2023年10月11日

LeapMind、半導体チップ作るってよ

AISemiconductor半導体

LeapMind CTOの徳永です。今日は新しい事業についての話をしたいと思います。

本日プレスリリースとして発表しました通り、LeapMindはAI用半導体チップ事業に参入します。開発はすでに開始しています。これまではエッジ向けに半導体IP、つまり、設計だけを売っていましたが、サーバーのマーケットでは半導体のデザインだけという商売は難しいので、実際のチップ(もしくはボード)の形でビジネスしていきます。新しい製品は、推論だけではなく、学習にも使えるものになります。

こう書いてしまうとたった一文のことではありますが、ビジネスとしてやるべきことは大幅に増えます。LeapMindはこれまでIPを販売してきましたので、基本的に在庫管理というものを行ってきませんでした。そのような会社からすると、物理的な商材を扱うというのはそれだけでも大変なことです。在庫管理、キャッシュフローの管理、需要の予測、プロダクトラインナップの絞り込み、などなど。知らないこと、わからないことだらけです。当然、他にも、やらないといけないことはたくさん増えます。

現在の半導体業界というのは非常に動く金額が大きくなっており、先端に近い半導体プロセスでチップを作ろうとすると数十億円から数百億円のお金が必要になります。開発を首尾よく進めればそれでよいわけではなく、様々なことを考えながらビジネスを進めていかねばなりません。

なぜやるのか

上述の通り、IPビジネスと比較するとずっとややこしい市場に参入するわけです。この決断は、複合的な理由によって判断されたものであり、一言で「〜〜だからやる」と明快に答えられるものではありません。しかし、いくつかの理由を断片的に示すことはできます。

まず、ビジネスとしてサーバー向けAI半導体の価値が高まってきていることは、皆様もご承知の通りでしょう。拡散モデルの学習もさることながら、大規模言語モデル(LLM)の学習にかかるコストが数年前よりも何桁も大きくなってきていて、しかも、大きなモデルを長く学習することにどうやら価値がありそうだ、ということが、実感を伴って見えるようになってきました。

弊社はもともと、「ニューラルネットワークの具体的な未来を予測することは難しいが、実用化にあたっては実行デバイスが絶対に必要だから、ニューラルネットワーク専用のプロセッサを提供する」という思想でやってきたので、価値が高まってきているマーケットに対してニューラルネットワーク専用のプロセッサを提供したい、というのは、もともとの会社の思想、目的と合致しています。

また、このビジネスはうまく成功すれば、幅広いデバイスでニューラルネットワークを普及させるための非常に重要な足がかりとなるでしょう。例えば、ニューラルレンダリングは流行している研究分野の一つですが、これからゲームなどでも普及する可能性があると考えています。実際の半導体デバイスを扱う会社に成長することで、そういった新しいマーケットにいち早く対応できるポジションを築きたいと考えています。

勝算はあるのか

さて、難しいビジネス、難しいマーケットに参入していくわけですが、果たして我々に勝ち目はあるのでしょうか。

技術的には、我々には、実際に半導体IPを提供し、物理的なチップとして動作させた実績があります。分野はちょっと違いますが、まっとうに動作するIPとソフトウェアを作れるという点については実績があります。マーケットにエントリーする資格はある、と自負しています。

スケーリング則を信じるならば、とにかく大規模なモデルを作ることが重要で、そのためには計算力の確保が重要です。ニューラルネットワークの学習は並列化できるため、単体で高速なプロセッサよりもコストパフォーマンスに優れたプロセッサの方が適しています。SIMTはプログラマからすると(SIMDよりも)扱いやすいですし、できることの幅も(SIMDよりも)広いですが、扱いやすさとパフォーマンスを両立するためにはキャッシュがほぼ必須になりますし、ニューラルネットワークだけを対象に考えるならば、ちょっとプログラマフレンドリーすぎて、ハードウェア側にそのしわ寄せが行ってしまっている、とも言えます。このあたりをバッサリとニューラルネットワークの学習と推論に特化することで、コストパフォーマンスを向上させることができると考えています。

また、プロセッサビジネスの場合、ハードウェアを作るだけではダメで、既存のソフトウェア資産を活かせるような仕組みが必要です。この点に関しては、数年前と比べて、状況は大幅に改善されてきています。ここだけ長々と書くのもバランスが悪いのでいくつかリンクを張るだけにとどめておきますが、PyTorchであればTritonの仕組みに乗っかることができるようになってきていますし、TensorFlowやJAXに関しては、OpenXLAプロジェクトの一部としてPJRTという仕組みができました。PJRT向けのプラグインを書けば、StableHLOフォーマットでネットワーク定義を受け取ってコンパイルし、実行することができます。このように、膨大なオペレーターのコードを手書きするのではなく、プリミティブなオペレーターさえ実装すれば、それの組み合わせでメジャーなDLフレームワークを動作させることができるようになってきているのです。

勝算があると言うための理由をいくつか並べてみました。正直なところ、どれだけの理由を連ねてみても、100%の勝算があるとは断言できません。とは言え、十分な勝算があると考えています。

最初は大型かつ高性能な製品からスタートする予定ですが、最終的には、今のGPUのように、秋葉原のパーツショップなどでも安価な製品が気軽に手に入るし、スーパーコンピューターにも当社の製品が搭載されている、という未来を目指します。

なぜプレスリリースを出したのか

開発を始める段階で大仰にプレスリリースを出すというのは、個人的には、好きではありません。うまく行かなかった場合に恥ずかしいですからね。そのようなリスクを負ってまで今回プレスリリースを出したのは、LeapMindが新しいビジネスに参入するのだ、ということを多くの人に知ってもらいたかったからです。冒頭に書いたとおり、チップを作るにあたっては、やらないといけないことがたくさん増えます。これから、様々な立場の人々に協力していただかなければ、成功にたどり着くことは難しいと考えています。

正直、半導体業界の特定の領域を除いて、LeapMindの知名度はまだ高くありません。今回のプレスリリースの主要な目的は、当社がこのようなチャレンジに取り組んでいることを皆様に知っていただくことです。そして、あわよくば、皆様に興味を持っていただけることを期待しています。この記事を通じてLeapMindの名前を初めて知る方々には、ぜひ当社の名前と、新しいAIチップの開発に挑戦していることを覚えていただけたら幸いです。

最後に

これまで、個人的にはAIという表現を可能な限り避けてきましたが、これからは、意固地になるのをやめて、AIという表現をふんだんに使っていきます。時代の流れに乗ります。こんにちはAI。