インタビュー自然言語処理 (略して NLP) は人工知能の重要な研究分野の 1 つであり、ここ数年で大きな進歩を遂げています。
結局のところ、書かれた言葉はどこにでもあり、それが科学的なテキスト、ニュース記事、ウィキのエントリ、あるいは単にあなたが選んだソーシャル プラットフォーム上のステータス更新の形であろうと、そのすべてを理解することに大きな関心が寄せられています。
NLPに特に熱心な企業の一つがFacebookです。同社のプラットフォームに対する評価はさておき、シリコンバレーの巨大企業が毎日処理しなければならないデータの量は、まさに驚異的です。そして、同社のプラットフォームには、既にNLPが組み込まれています。例えば、翻訳機能などがその例です。
Facebookは、NLPをはじめとするAIの可能性をさらに発展させるため、Facebook AI Research(FAIR)という名称の研究施設ネットワークに投資しています。ロンドンオフィスは、ユニバーシティ・カレッジ・ロンドンで自然言語処理と機械学習の教授も務めるセバスチャン・リーデル氏が率いており、今月末に開催されるThe Register主催のAIカンファレンス「MCubed」の基調講演者も務めています。
しかし、それで何ができるのでしょうか?
リーデル教授はプレゼンテーションに先立ち、自身の研究について、そしてこの分野全体について少しお話を伺いました。「私の研究は、機械がテキストから読み取った知識をどのように表現し、保存すべきかという問題を中心に展開しています。機械は100万冊もの本を持ち歩き、必要な時に読むべきでしょうか?それとも、すべてを記憶しておくべきでしょうか?」と教授は語りました。「次に、機械がこの知識を、複雑な質問に答えるなど、様々なタスクに活用できるようにしたいと考えています。」
Facebookに関連したユースケースの1つとして、リーデル教授は「ソーシャルレコメンデーション」と表現しています。「人々が提案を求めたり、提案をしたりするときに使用する言語を理解することで、私たちのシステムは自動的にそれらの提案をより役立つものにすることができます。例えば、地図上でレストランのおすすめを整理するなどです。」
これに加え、すでに述べた機械翻訳に加えて、NLPはソーシャルメディアの文脈でしばしば議論される問題、つまり有害コンテンツに関しても人間を支援するとされています。リーデル教授によると、「NLPシステムは、人々が目にしたり報告したりする前であっても、ポリシーに違反するコンテンツを積極的に特定し、対処するのにも役立ちます。」
Facebookアカウントをお持ちで、この種の研究にデータを提供するかどうか確信が持てない方も、リーデル教授は、あなたの機密情報がこれらの研究に利用されることはないと保証します。「FAIRでは、AIの最新技術の向上を目指し、オープンで再現可能な研究に重点を置いています。これは多くの場合、より広範な研究コミュニティと共有される公開データセットを選択し、個人情報や機密データの使用を避けることを意味します。」
FAIRだけがその道を進んでいるわけではありません。AI導入の道を進む企業はますます増えており、個人データのプライバシー保護に役立つフェデレーテッドラーニングなどの技術を検討しています。しかし、この分野は現在、大きな変化の真っ只中にあり、Riedel and Co.にとっては非常にエキサイティングな時代を迎えています。
「最初の大きな変化は3年前、ディープニューラルネットワークの再登場によって起こりました。そして昨年、ELMoとBERTのリリースにより、もう一つの重要な変化が起こりました。これらは、大規模なラベルなしテキストコレクションを活用して下流モデルに優れた特徴量を提供する、事前学習済みの文脈的単語表現です。」
追いつき、恩返しする
しかし、それは大変な仕事でもあります。「NLPの仕事は刺激的な時期でしたが、同時に、変化のスピードに対応するために、UCLのコースモジュールをほぼ毎年根本的に変更しなければならないことも意味しています。」
しかし、スポーツジャケットを脱ぐという選択肢はない。「私は今でも教え続けています。なぜなら、それが楽しいから。次世代のAI研究者、スタートアップの創業者、教師、エンジニアの育成に貢献したいから。そして、それが業界がより広いAIコミュニティに貢献できる一つの方法だからです。」
FacebookとCMUの研究者が開発したエースホールAIボットが、いかにして人間のポーカープロを圧倒したか
続きを読む
NLPの近い将来を見据え、教授は「言語と記憶の分野における大幅な進歩」を期待しています。「現在、私たちは短いテキストを処理して、それに関する質問に答えたり、分類したりすることは得意です。しかし、例えばWikipedia全体を読み、その知識を下流で活用する方法はまだ明らかになっていません。今年は、この分野で興味深い研究がいくつか発表されています。」
彼は長文テキスト生成の面でも改善が見られることを期待している。「言語モデルは今では『言語のように見える』テキストを生成できますが、よく見ると表面的な意味しか理解できないことがよくあります。英語やその他の主要言語以外にも、多言語NLPの真の進歩を期待しています。」
このテーマに関心のあるエンタープライズ開発者に向けて、教授は、今後のプロジェクトにおけるNLPの活用について議論する際に役立つポイントをいくつか挙げています。「まず、多くのエンタープライズデータ(および知識)は、データベースに構造化された形式で保存されているのではなく、非構造化テキストとして存在しています。この知識を大規模に活用するには、機械が「理解」できる方法で処理および表現する必要があります。そして、ここでNLPが役立ちます。」
「第二に、言語は人々が周囲のシステムと対話するための最も自然なインターフェースであることが多いため、企業がこの対話を自動化、または半自動化することは有用な場合があります。」®
NLPについてさらに詳しく知りたい方、あるいはセバスチャン・リーデル氏に直接質問がある方は、今すぐMCubed London 2019のチケットをご購入ください。9月30日には、QE II Centreで開催されるAIと機械学習に関するカンファレンスで、リーデル教授がオープニング基調講演を行います。