Mozilla は音声認識をオープンソースにすべきだと決定し、まさにそれを実現するためのプロジェクトである Project Common Voice を立ち上げました。
ブラウザビルダーが求めているのは、音声認識アプリ用のオープンソースのデータセットだという。
Mozilla の Daniel Kessler 氏は、オープンソース コミュニティは「次のイノベーターたちの波」であると書いているが、音声データセットが独自の壁に閉じ込められているため、彼らは取り残されている。
これにより、音声認識は最も収益性の高い市場(英語、中国語、および「特定の言語グループ」)に偏向することになりますが、Mozilla は十分な数の参加者が、あまり一般的でない言語の話者がブラウザーに話しかけられるようにしてくれることを期待しています。
ここでオープンなデータ収集が登場します。興味があれば、Project Common Voice サイトでユーザーは自分の音声を録音したり (現時点では英語から開始して、システムに文章を読み上げます)、ソフトウェアが他の話者をどの程度正確に認識するかを確認したりできます。
(Vulture South の観察によれば、このページは Chrome よりも Firefox でより適切に動作するとのことです。驚くべきことに、当然ながら、ページにマイクの使用許可を与える必要があります。)
同社は最終的に1万時間分の録音を収集し、今年の第4四半期にリリースしたいと考えています。おそらく、開発者や研究者が最初のサンプルを入手したら、プロジェクトは他の言語へと移行するでしょう。®