ドラゴンを訓練したいですか?5億個のファイル、730TBのデータ、54,000個のCPUコアが必要になります...

Table of Contents

ドラゴンを訓練したいですか?5億個のファイル、730TBのデータ、54,000個のCPUコアが必要になります...

DataStax Accelerateファミリーで人気の DreamWorks Animation は、グラフ データベースと Gremlin クエリ言語を使用して映画の制作をガイドするマイクロサービスを利用したクラウド プラットフォームを構築しました。

このデジタルパイプラインは、初期のプリビズから最終レンダリングまですべてを処理し、次作にも採用される予定です。このセットアップは長期間にわたってテストされており、ソフトウェアエンジニアは、その性能を確かめるために、完全なフェイクショーを作成しました。このプラットフォームのアーキテクチャについては、今週アメリカの首都で開催されたDataStax Accelerateカンファレンスで初めて説明されました。

3Dアニメーションは過去20年間で大きく進歩しました。映像の複雑さが増すにつれ、ハリウッドはより高速なソフトウェアとハ​​ードウェアを求めるようになりました。『マダガスカル』『カンフー・パンダ』を思い浮かべる時、3Dアニメーションはまず思い浮かばないかもしれませんが、これらは芸術的であると同時に、技術的な成果でもあります。

「ワークフローは膨大です」と、ドリームワークスの主任エンジニア、ダグ・シャーマン氏は聴衆に語った。「膨大なプロセスと膨大なファイルがあります。では、どうやってそれらの情報をすべて取り込むのでしょうか?」

ここにドラゴンがいる

チームは喜んで例を挙げました。最初のシュレック映画 (2001 年) にはドラゴンが 1 匹登場し、450 万のファイルと 7 TB のデータが使用され、2,000 個の CPU が必要でした。

2月に公開されたドリームワークスの最新作「ヒックとドラゴン」には、6万匹のドラゴンが登場し、5000億のファイルと730TBのデータが使用され、レンダリングには54,000個のCPUコアが必要だった。当時、同スタジオは年間3本の映画を公開していた。

「製作には何年もかかります」とシャーマン氏は言った。「毎年7本から10本の映画が製作されているので、その数を全部10倍にしなければなりません」

「ドリームワークスほどの予算をかけていない多くのテレビアニメーションスタジオは、複雑なストーリーを制作することを避けがちです。なぜなら、そうしたストーリーを語るには多くの技術が必要になるからです。私たちはとにかく挑戦します。突拍子もないことでも、です。」

DataStax Accelerate – CEO ビリー・ボズワース

DataStaxはApache Cassandraの最新調整版であるConstellationに注目している

続きを読む

ドリームワークスは、映画制作の全プロセスを追跡・管理し、制作のさまざまな段階を連携させる方法を必要としていました。スタジオは、この目的のためにDataStax Enterprise Graphを選択しました。DataStax Enterprise Graphは、Facebookで開発されたNoSQLデータベースであるApache Cassandraと、複数のデータベースベンダーがサポートするグラフコンピューティングフレームワークであるApache TinkerPopという2つのオープンソースプロジェクトを基盤としています。

グラフデータベースは通常、データポイント間の関係性を識別・分析するために使用されます。ドリームワークスでは、データポイントとは3Dモデル、照明、リグ(モデルを動かす仮想の骨)といったCGIアセットを指します。「これらは映画が完成するまで、ある部門から次の部門へと受け渡されるものです」とシャーマン氏は語ります。

「グラフについて話しているのは、私たちのスクリプトチーム、これらの作業を行うシンプルな方法、そして力ずくの手法ではスケールしないことが分かっていたからです。そして、より複雑な処理をしたいと考えていました。そこで、マイクロサービスに注目したのです。」

「これらの設計はクラウドとの相性が非常に良いため、インド側が何らかの支援をしたいと決断し、中国のスタジオが協力したいという状況にも対応できる体制が以前よりもはるかに整っています。この作業方法と互換性がなかったソフトウェアも、コンテナ化され分散されているため、今では互換性があります。」

おいしい

DreamWorks のテクノロジー スタックの最も重要な要素の 1 つは Gremlin です。これは、TinkerPop の中核を成す比較的新しいグラフ トラバーサル言語であり、リレーショナル データベースにおける SQL と同じ目的を本質的に果たします。

「グレムリンの学習曲線は非常に急峻で、非常に複雑です」と、ドリームワークスのシニアソフトウェアエンジニア、ショーン・フェネル氏は述べた。「複雑な学習曲線があるからこそパワーも得られるのですが、データへのアクセス方法やデータの書き込み方法を正しく習得するには長い時間がかかり、私たちは今もなお、こうした多くの点を試行錯誤しているところです。」

「Gremlin は、他のどのクエリ言語よりも多くの処理を実行できます」と彼は付け加えた。

DreamWorks チームはこれまでリレーショナル DB に依存していたため、グラフ データベースの経験はありませんでしたが、Netflix でのグラフの適用方法について聞いた後、勇気を出して試してみることにしました。

「概念実証を構築していた時、私たちは制作側と直接連携して、本物を作りたかったんです。箱入りのおもちゃを作ってそのまま渡すようなことはしたくなかったんです」とフェネル氏は語る。「模擬ショーを作りました。そして、その過程で、グラフがまさにこの用途に使えることを証明したんです。」

「これがこのマシンの心臓部です。文字通り、私たちのプロセス全体がこのグラフデータベースに収められています。そして実際に、次の機能でこれを公開する予定です」とシャーマン氏は付け加えた。®

Discover More