Aozora アプリ

Humanitext Aozora

Humanitext Aozoraは、日本のデジタルライブラリー「青空文庫」が誇る約1,000人の作家による17,000以上の作品群を、AIとの対話形式で探求するための革新的なプラットフォームです。夏目漱石や芥川龍之介といった文豪たちの作品をデータベース化し、AIが生成する回答には必ず出典を明記する「検索拡張生成(RAG)」技術を採用。これにより、利用者は学術的な信頼性を担保された環境で、作品のテーマや登場人物の心情、美しい日本語表現の背景を深く知ることができます。文芸研究の新たな地平を拓く、専門家から学生、文学愛好家まで、すべての人のための研究・読書ツールです。

ハイライト

  • 約1,100作家、17,000作品以上をAIと対話形式で探求
  • 青空文庫の出典明記(RAG)で学術的な信頼性を確保
  • 研究から創作まで応える5つのユニークな出力モード
  • ジャンル・作家・作品による高度な絞り込み・除外機能
YouTubeで動画を見る

Humanitext Aozoraとは?

Humanitext Aozora(ヒューマニテクスト・アオゾラ)は、日本の共有財産である「青空文庫」を舞台に、AI技術を用いて日本近代文学の森を深く探求するプロジェクトです。その名は、私たちの活動が青空文庫という偉大な先人の努力の上に成り立っていることへの敬意を表しています。

このシステムの技術的な心臓部は、意味の近さで検索するDense検索と、キーワードの一致を捉えるSparse検索を組み合わせたハイブリッド検索パイプラインです。利用者の日本語の質問は、まずAIによって文脈を理解した英語の検索クエリに変換され、この2つの方法で青空文庫のデータベースから関連性の高いテキスト断片を高速に検索します。さらに、抽出された断片をAIが再度ランク付け(Rerank)し、最も質問意図に合致する質の高い文脈だけを厳選します。

この厳選された文脈のみを基に、大規模言語モデル(LLM)が回答を生成するため、LLMが自身の学習知識だけで不正確な情報を答えてしまう「ハルシネーション」を効果的に抑制し、すべての回答が検証可能な典拠に基づくという高い信頼性を実現しています。

目的:言葉の海を渡り、作家の魂に触れる

日本近代文学は、激動の時代を生きた人々の葛藤や喜び、そして現代にまで通じる普遍的なテーマが、美しい日本語で織りなされた世界です。Humanitext Aozoraは、この豊かな言葉の海を誰もが自由に航海できるよう、それぞれの立場に合わせた羅針盤を提供します。

  • 専門家(研究者)のために 特定の作家の文体分析や、異なる作家間でのテーマの扱われ方の比較研究を、圧倒的なスピードで実現します。これまで見過ごされてきた作品間の意外な繋がりを発見するなど、研究に新たな視点とインスピレーションをもたらします。

  • 学生のために 近代の古風な言い回しや歴史的背景をAIに質問しながら、作品の理解を深めることができます。「主人公のこの時の気持ちを説明して」「この比喩表現が意味するところは?」といった問いを通じて、内容理解を力強くサポートします。

  • すべての文学を愛する人々のために 好きな作家の異なる作品に共通するテーマを探したり、登場人物の行動の理由を問いかけたりと、作品をより多角的に楽しむための対話相手となります。「太宰治の描く女性像について教えて」といった気軽な質問から、自分だけの作品解釈を深めていくことができます。

基本機能と使い方

Humanitext Aozoraは、高度な機能を持ちながらも、その操作はシンプルで直感的です。誰でもすぐに、文豪たちとの知的な対話を開始できます。

1. ジャンル・作家・作品を選ぶ(任意)

検索の精度を高めるため、対話の範囲を柔軟に設定できます。

  • ジャンルフィルター: 日本十進分類法(NDC)に基づき、「小説・物語」「詩歌」「評論」といった大分類から小分類まで、ジャンルで作家群を絞り込めます。
  • 著者フィルター: 表示された作家リストから、対象としたい作家を複数選択できます。
  • 作品フィルター: 特定の作家を選択した上で、「さらに作品を選択する」ボタンを押すと、その作家の作品群から調査対象をさらに絞り込むことが可能です。
  • 除外機能: 「選択した著者(および作品)を検索から除外する」にチェックを入れると、例えば「夏目漱石の作品以外における『自己』の概念」といった高度な調査が可能になります。

2. 出力モードを選ぶ

利用者の多様なニーズに応えるため、5つのユニークな出力モードを備えています。

  • Q&Aモード: 特定の事柄に対する簡潔な回答と、その根拠となる正確な出典(例:(夏目漱石『こころ』第15節))を知りたいときに使います。
  • 詳細解説モード: 文芸研究者のように、複数の典拠を比較・分析し、時代背景や文脈を補足しながら多角的な解釈を提供します。作品理解を深めるための補助ツールとして最適です。
  • 対話モード: 指定した作家(例:芥川龍之介)や作中の登場人物のペルソナ(文体、思想、口調)をAIが再現し、利用者との対話を行います。文学の世界への没入体験を提供します。
  • 創作モード: 指定した作家の文体をAIが学習し、そのスタイルを模倣した新しい文章を創作します。「もし坂口安吾が現代の渋谷について書いたら?」といった創作活動の支援を目的としています。
  • カスタムモード: あなただけの最適なAIアシスタントを構築するためのモードです。引用の言語(原語/翻訳)、解説の詳しさ、回答のスタイルなどを細かく設定することで、ご自身の研究・学習スタイルに完全に合致した応答を引き出すことができます。
  • No Contextモード: このモードを選択すると、RAG(典拠検索)を行わず、LLMが持つ広範な内部知識だけで回答します。青空文庫の範囲を超えた文学史全体の文脈で議論したり、文語・古語を現代語訳させたりと、より自由な対話が可能です。ただし、典拠がないため不正確な情報を含む可能性があります。

3. 質問を入力する

チャットボックスに、知りたいこと、考えたいことを自由に日本語で入力します。一つの答えに満足せず、AIの回答をきっかけに、さらに質問を重ねていくことが、思わぬ発見への近道です。

(入力例)

  • 芥川龍之介の『羅生門』と『鼻』に共通するテーマは何ですか?
  • 宮沢賢治の作品における「自然」の描かれ方について、具体例を挙げて教えてください。
  • 『吾輩は猫である』の主人公の猫の視点から、当時の社会を風刺的に説明して。

4. 回答と典拠(Sources)を確認する

「No Contextモード」以外では、AIが生成した回答の基になった文脈が「Sources」欄に表示されます。[作品ID 著者名 『作品名』 / Score: 0.85] のように、AIが判断した関連性の高さ(スコア)と共に一覧化されます。詳細(▼)を開けば、引用された文章の全文や青空文庫へのリンクを確認できます。

この「AIとの対話」と「典拠(原典)への回帰」の往復運動こそが、Humanitext Aozoraが提案する新しい学びと研究の形です。

Humanitext Aozoraと共に、日本近代文学の新たな魅力を発見する旅に出かけましょう。