Yahoo! 検索! 結果!、おすすめ!、広告! 投げつけ! コード! が! オープン! ソースになりました!

Table of Contents

Yahoo! 検索! 結果!、おすすめ!、広告! 投げつけ! コード! が! オープン! ソースになりました!

ベライゾン傘下のヤフーの親会社であるオースは、ヤフーの検索コード「ベスパの管理を放棄し、これをオープンソース プロジェクトにした。

スクーターとは全く関係のないこのソフトウェアは、構造化データと非構造化データのクエリ、結果の整理とランク付け、そして大規模なデータ書き込みを行う手段を提供します。これは、大規模なデータセットに対してリアルタイムで計算を実行するシステムです。

「速度とスケールの両方を実現するために、Vespaは単一のマスターをボトルネックとすることなく、データと計算を複数のマシンに分散します」と、Yahoo!の著名な(ソフトウェア)アーキテクトであるジョン・ブラッツェス氏はブログ記事で説明しています。「従来のアプリケーションは、処理のためにデータをステートレスな層に引き込むのに対し、Vespaは計算をデータにプッシュします。」

Vespaは、ノードのクラスターを管理し、マシンの故障や新しいキャパシティの追加時にデータを再分配することでこれを実現すると説明されています。Elastic Searchやリレーショナルデータベースなどのサービスと一部重複しますが、ミドルウェアコンテナのロジックやライブ再構成も処理します。

Vespa は、Yahoo.com、Yahoo News、Yahoo Sports、Yahoo Finance、Yahoo Gemini、Flickr などのサービスで検索クエリの処理、コンテンツの推奨、広告の配信に使用されており、その登場は評価の高い開発者たちから熱烈なツイートを引き出しました。

「長年の開発期間と多大な知恵と革新の成果です。これを実現したVespaチームとYahoo!に称賛を送ります」とAmazonの副社長兼著名なエンジニアであるアモッツ・マイモン氏は述べた。

ハドゥープ

HadoopとSparkの使い方が間違っていると、おそらく失敗するでしょう

続きを読む

「VespaはYahooがこれまでに開発したソフトウェアの中で最高のものです」と、npmjsの共同創設者兼COOであるローリー・ヴォス氏は述べた。「ElasticSearchに似ていますが、100倍優れています。本当に嬉しいです。」

これまで、Yahoo !の最大のコードヒットは Hadoop でした。これは、検索ビジネスによって開発され、2006 年に Apache オープン ソース プロジェクトとして成功を収めた分散ストレージおよびデータ処理フレームワークです。

Hadoop は、Cloudera、Hortonworks、MapR など、大規模なデータ処理に重点を置く企業向けの市場を開拓しました。

ブラッツェス氏によると、Vespaはここ数年で大幅に改良され、最新のコンピューティングスタックに適合してきたという。Vespaは、開発者が巨大なデータセットやモデルをサービスシステムに提示し、リクエスト時に計算を処理できるようにする。これにより、他のアプローチよりもコストと複雑さを抑えながら、より優れたユーザーエクスペリエンスを実現できると彼は付け加えた。®

Discover More