2022年11月30日にOpenAIが公開した「ChatGPT」は、世界のユーザー数が2か月で1億人に達するほど急速に拡大、その後Googleの「Gemini(ジェミニ)」、Anthropic の 「Claude(クロード)」など同様のサービスも登場し、機能的にも進化が続き、画像、動画分野でも多くの生成AIが使われるようになった。
文章の生成、分類、情報抽出、要約、質問応答、翻訳などは、大量のテキストデータを使って学習された「大規模言語モデル(LLM:Large Language Models)」によって行われており、生成AIチャットはクラウドサーバー上にあるLLMによって処理されている。
そのためAIサーバーの需要が急増し、大量のデータを並列処理するGPU(Graphics Processing Unit)と呼ばれる半導体の最大手エヌビディアの製品需要が急増、株価が高騰して時価総額が一時2兆ドルとなり、世界の株式市場もAI関連株の牽引により昨年は22.2%高、米ナスダックが43%高、日経平均が28.2%高となった。
クラウドサーバー型の生成AIチャットが主流となる中で、Facebookやインスタグラムを提供しているメタ(Meta)は、昨年7月18日に「Llama(ラマ)2」という自分のパソコン上だけで動くLLMを誰でも自由に使える「オープンソース」として公開した。
■ローカルLLM
ChatGPTやGeminiなどはWebブラウザから手軽に利用できるが、LLMの部分は非公開で、自社のデータや業界情報などを学習させることができないし、企業情報や個人のプライバシーの観点からの懸念もあるため、最近はネットに接続せず、自分のパソコンで処理を行う「ローカルLLM」が注目されている。
しかし、LLMを自分のパソコン上(ローカル)で動かすためには、ある程度以上の高速な処理能力、大容量メモリ、先進的な機能などを持つパソコンや知識が必要となるが、計算量を削減する「モデル圧縮」技術も開発され、使えるようになってきた。
「剪定(Slice=不要な部分を削除)」「量子化(quantization=低精度化)」「蒸留(Knowledge Distillation=大きなモデルから小さなモデルへ知識を移転)」などと呼ばれる手法で小型化されたLLMが用意されているので、私も4月19日に発表されたメタの「Llama 3」を入れてみた。
「Llama 3」は日本語での問いかけはできるが、基本的には応答は英語で返ってくるので、日本語に翻訳する手間はあるし、インターネットに接続しない環境で使うので、リアルタイムにネットで検索したデータやニュースをもとにした返答はできないが、AIに関する英語や日本語の論文や記事の要約は妥当な内容だった。
大谷翔平選手についのディスカッションでは、最初は見当外れな答えをしたものの、「それは間違いです。大谷翔平は有名な大リーガーです」などと教えたら、データは少し古いがちゃんとした返答が返ってきた。
「Llama 3」の高性能版は「ChatGPT」の最新版「GPT-4」に非常に近い性能を持つとされているため、今後はサーバー型生成AIの競争と共に、サーバー型AIとローカル型AIという競争も出てきそうだ。
インターネットやスマートフォンと同様に、新たに登場した生成AIをいかに賢く使いこなしてゆくかも、今後の課題の一つだ。
======== DATA =========
●ChatGPT
https://chatgpt.com
●Gemini
https://gemini.google.com/
●Meta Llama 3
https://llama.meta.com/llama3/