言語学者の皆さん、履歴書を更新してください。百度は高速AI翻訳を突破したと考えているからです。

Table of Contents

言語学者の皆さん、履歴書を更新してください。百度は高速AI翻訳を突破したと考えているからです。

中国の検索大手、百度(バイドゥ)と米国オレゴン州立大学の最新研究によると、AIは人が話している間にリアルタイムで言語を翻訳できるという。

人間の通訳者は、音声を聞きながら同時に翻訳するために、超人的な集中力を必要とします。資格を持つ同時通訳者はわずか数千人しかいないと言われており、その仕事は非常に過酷であるため、通訳者は2人1組で作業することが多く、20~30分ごとに交代します。会話が進むにつれて、ミスの可能性は飛躍的に高まります。

機械は優れた記憶力と疲労のなさを考えると、このタスクにおいて人間を上回る可能性を秘めている。しかし、百度(バイドゥ)とオレゴン州立大学の研究者が明らかにしたように、機械にとっても容易なことではない。

彼らは、中国語と英語をほぼリアルタイムで翻訳できるニューラルネットワークを構築した。英語への翻訳は最大で少なくとも5語遅れる。この成果はarXivの論文に掲載されている。

バベルの塔後の喧騒

言語によって文法構造が異なり、文の語順が一致しないことが多く、迅速な翻訳が困難になります。迅速な翻訳の鍵は、話者が話している途中で次に何を言うかを予測することです。

AIエンジンでは、エンコーダーが対象言語の単語をベクトル表現に変換します。デコーダーは、前の文の単語に基づいて次の単語の確率を予測します。デコーダーは常にエンコーダーの背後で動作し、音声またはテキスト全体を処理するまで翻訳語を生成します。

「ある例で、中国語の文章『ブッシュ大統領がモスクワで…』では、『ブッシュ大統領』の次にくる英語の単語は『meets』である可能性が高い」と、百度研究の主席科学者、リアン・フアン氏はThe Registerに説明した。

「これが可能なのは、トレーニングデータに「ブッシュがモスクワでプーチン大統領など誰かと会う」という例が多数含まれているため、システムは「ブッシュがモスクワにいる」なら誰かと「会う」可能性が高いと学習したからです。

他の例もここで聞くことができます。

言語の問題

翻訳の難しさは言語によって異なると黄氏は付け加えた。例えばフランス語とスペイン語のように、関連性の高い言語は構造が似ており、語順がより揃っている。

ウォール街の強気派と対峙する少女の像

科学者がGoogle翻訳を性差別的だと非難

続きを読む

日本語とドイツ語の文は、主語が文頭、目的語が文中、動詞が文末に来る構造(SOV)です。英語と中国語も主語から文が始まりますが、動詞が文中に置かれ、目的語が文末に来る構造(SVO)です。

そのため、日本語とドイツ語から英語と中国語への翻訳はより困難になります。「国連では、ドイツ語から英語への通訳者はしばしば間を置いて『ドイツ語の動詞を待たなければならない』という有名なジョークがあります。標準アラビア語とウェールズ語は動詞-主語-目的語の文型で、SVOとはさらに異なります」と彼は言いました。

この新しいアルゴリズムは、コードをわずかに調整するだけで、あらゆるニューラル機械翻訳モデルに適用できます。すでに百度(Baidu)の音声テキスト翻訳に統合されており、来週11月1日に北京で開催される百度ワールドテックカンファレンスで披露される予定です。

「この製品が一般向けにいつ発売されるか正確な時期は決まっていないが、これは間違いなく百度が取り組んでいることだ」とリャン氏は語った。

「需要の高まりに伴い、当社の技術によって同時通訳がより身近で手頃な価格になると考えています。また、この技術によって人間の通訳者の負担も軽減されると考えています。」®

Discover More