最新の研究によると、自分の犬を理解したい人は、AI の助けを得られるようになるかもしれない。
ミシガン大学の研究者たちは、犬の吠え声が遊び心や攻撃性を伝えているかどうかを識別できるツールを開発している。これは、多くのReg読者にとってはすでに明らかなはずだ。
MLは、あのリラックスできるクジラの歌は、人間のようなゴシップかもしれないと示唆している
続きを読む
同時に、動物の発声から年齢、品種、性別といった他の情報も理解したいと考えています。ミシガン大学の研究チームは、メキシコ国立天体物理学・光学・電子研究所と共同で、もともと人間の発声で訓練されたAIモデルが、動物のコミュニケーションをターゲットとした新しいシステムの訓練の出発点として利用できることを発見しました。
結果は、計算言語学、言語資源および評価に関する合同国際会議で発表されました。
「当初は人間の音声で訓練された音声処理モデルを使用することで、私たちの研究は、音声処理でこれまで構築してきたものを活用して犬の鳴き声のニュアンスを理解し始める方法についての新たな窓を開きます」と、コンピューターサイエンスとエンジニアリングの教授であるラダ・ミハルセア氏と、この研究を実行したミシガン大学のAI研究所の所長であるジャニス・M・ジェンキンス氏は述べた。
「私たちとこの世界を共有する動物たちについて、まだ知らないことがたくさんあります。AIの進歩は、動物のコミュニケーションに関する私たちの理解に革命をもたらす可能性があり、私たちの研究結果は、ゼロから始める必要がないかもしれないことを示唆しています」と彼女は述べた。
しかし、人間の言語の AI モデルは膨大なテキストのコーパスでトレーニングされているのに対し、犬はタイピングがあまり得意ではないため、犬の声が録音される頻度は人間ほど多くありません。
この問題を克服するため、研究者たちは元々人間の音声を分析するために設計された既存モデルを再利用しています。様々な音声対応技術を基盤として、トーン、ピッチ、アクセントといった人間の音声の重要な特徴を拾い出すように訓練されています。
- エアバス、戦闘機パイロット向けの無人AI搭載ウィングマンを公開
- AI カトリックの「司祭」、ゲータレードを使った洗礼を勧めた後に聖職剥奪
- 科学者の中には、研究論文を書くためにAIを使うのをやめられない人もいる
- ボストン・ダイナミクスのヒューマノイド「アトラス」は消滅したが、長生きしてほしい…新しい商用「アトラス」
「これらのモデルは、人間の言語や発話の非常に複雑なパターンを学習し、エンコードすることができます」と筆頭著者で博士課程の学生であるアルテム・アブザリエフ氏は述べた。
研究者たちは、人間の音声モデル Wav2Vec2 を使用して、さまざまな状況でさまざまな品種、年齢、性別の犬 74 匹から録音された犬の発声のデータセットを構築しました。
その結果、Wav2Vec2 は犬の鳴き声データに特化してトレーニングされた他のモデルよりも精度が優れており、4 つの分類タスクで成功したことがわかった。
犬の吠え声データはどのように収集されるのでしょうか?研究者たちは、遊んでいるとき、攻撃的なときなど、様々な状況における犬の吠え声を録音します。そして、モデルが吠え声の例を識別する能力をテストします。例えば、見知らぬ人への非常に攻撃的な吠え声、見知らぬ人への通常の吠え声、ネガティブなキーキー音、ネガティブなうなり声(見知らぬ人がいる場合)などです。研究者たちは吠え声の文脈を既に把握しているため、どの吠え声がどの吠え声なのかを判別できるのです。
「人間の発話に最適化された技術が、動物のコミュニケーションの解読に役立てられたのは、今回が初めてです」とミハルセア氏は述べた。「私たちの研究結果は、人間の発話から得られた音とパターンが、動物の発声など、他の音の音響パターンを分析・理解するための基盤となり得ることを示しています。」®