失礼ですが、私たちの主であり救世主であるイエス・キリストの教えを聞いたことがありますか?

Table of Contents

失礼ですが、私たちの主であり救世主であるイエス・キリストの教えを聞いたことがありますか?

ソフトウェアは、学者によって、聖書の原文を徹底的に研究した後、さまざまなスタイルの聖書本文を作成できるようにトレーニングされています。

米国のダートマス大学とインディアナ大学ブルーミントン校で開発されたこのニューラルネットワークは、人工知能コードが一つの形式で文章を精査し、それを使って別の形式で散文を作成する興味深いデモンストレーションだ。

これは最終的には、たとえば、複雑な情報を、もちろんコンピューターによって自動的に、わかりやすい説明に変換するために使用できます。

今週レジスター紙に語った、ダートマス大学の博士課程の学生で、水曜日に王立協会オープンサイエンス誌に掲載された研究成果の論文の共著者であるキース・カールソン氏は、「聖書が言語タスクにとってこれほど優れたデータセットとなる理由はいくつかあります。

多くの言語に翻訳されており、主要言語版も多数存在するため、その幅広さだけでも便利です。

実際、Google翻訳のような機械翻訳システムは聖書を学習しているようです。例えば、フランス語版の文章はドイツ語版の一部に直接リンクできるため、ニューラルネットワークは段落で使用されているフランス語とドイツ語の単語の意味を結び付けることができます。ユーザーが特に珍しい言語間で奇妙な文を翻訳しようとすると、不気味なことに、同じ文章が再び現れることがあります。

聖書はすでに、異なる版間で一致するように、小さな断片に分割され、節番号が付けられています。「多くのNLPタスクのシステムでは、このような対応付けが必要ですが、聖書を使用することで、エラーの原因となる可能性のある自動対応付けアルゴリズムを使用する必要がなくなります」とカールソン氏は付け加えました。

しかし、この実験の研究者たちは機械翻訳ではなく、文体の転移に焦点を当てました。彼らは論文の中で、文体の転移は機械翻訳と似た問題であると主張しました。「文体の転移は、当然ながら、原文言語と訳文言語の文体が異なるだけの機械翻訳の問題と捉えることができる」

歴史

研究者たちは、1604年に書かれたジェームズ王欽定訳聖書や、1901年に完成したより現代的なアメリカ標準訳聖書(ASV)など、さまざまなバージョンの聖書を使ってニューラルネットワークを訓練し、さまざまな散文体で聖書の一節を再現できるようにした。聖書のさまざまなスタイルで聖書の一節を検索できるウェブサイト「Bible Gateway」から、33の英語訳聖書が収集され、ネットワークに入力されて学習された。

このデータセットには、さまざまな聖書バージョンのソースとターゲットの詩の150万を超える固有のペアが含まれており、システムのトレーニングに使用されました。

ニューラルネットワークと神

以下は、テストとしてリカレント ニューラル ネットワークに与えられた Basic English (BBE) 版聖書から取得した入力テキストの例と、AI が ASV スタイルに翻訳した出力テキストです。

入力(BBE): 「その後、レビ人は主の箱と金の像の入っていた箱を降ろし、それを大きな石の上に置いた。ベテ・シェメシュの人々はその日、主の前に全焼の供え物をして礼拝した。」

出力(ABV):「そしてレビ人はエホバの箱と金の像の入った箱を運び下ろし、それを大きな石の上に置いた。ベテ・シェメシュの人々はその日、エホバの前に香をたき、礼拝した。」

テキストを公平に表現するためには、テキスト全体の意味が保持されなければならない。リカレントニューラルネットワークがどのようにテキストを生成し、どのような特徴を拾い上げるように学習するのかを理解するのは難しいと、カールソン氏は認めた。

「REEM」ロボットが段ボール箱を運ぶ。写真はPal Robotics SL提供。CC BY-SA 3.0ライセンス(コモンズ経由)

Wikipediaロボット編集者に餌を与えて育てる方法

続きを読む

「入力文全体を読み取り、それを表すベクトルを作成することで動作します」と彼は述べた。「出力を生成するには、このベクトルを用いて、既に生成した単語に基づいて、一度に1つの単語を生成します。ニューラルネットワークが学習した特徴は、解釈が非常に難しいことで知られています。」

彼は、これらのツールが、さまざまな人々がテキスト情報をより利用しやすくなるよう役立つことを期待しています。

「例えば、テキストを子供や非ネイティブスピーカーにも理解しやすいように書き直すことも可能です」と彼は提案した。「同様に、技術論文や法律文書など、高度な技術を要する内容の意味を一般の人が理解しやすいようにテキストを書き直すことも可能です。」

アクセシビリティ以外にも、テキストを特定の著者のスタイルに合わせて書き換えることが可能です。これは、例えば小説を別の著者のスタイルで書き直すといった単なる好奇心からかもしれませんし、より実用的な機能、例えば企業内で製品の説明文を作成するライターチームが、文章全体を通して一貫した文体を維持できるようにするといった目的からかもしれません。

他の研究者たちはすでに後者を用いて同様の実験を行っています。ニューヨーク大学の研究者によって開発されたニューラルネットワーク「DeepTingle」は、ゲイのエロティカ作家であるチャック・ティングル風の文章を吐き出すことができました。®

Discover More