ChatGPTを導入した企業、活用している業務、活用ルールなど、ChatGPTに対する企業の取組みが連日のように報道されています。また、雑誌やネットなどでは個人を対象にしたChatGPT活用術が数多く紹介されています。仕事術や勉強法などが代表でしょう。
一方で、ChatGPTは嘘ばかり教えて役に立たないという意見も聞きます。私たちの働き方や生活を一変させると言われているChatGPT。今日からどう付き合っていけばよいのか、武蔵野大学データサイエンス学部データサイエンス学科長 中西崇文さんにお伺いしました。
ChatGPT誕生の背景
――そもそも、生成AI(学習したデータから新たなコンテンツを作れるAI)は、いつ頃から注目されるようになったのでしょうか。
一気に注目度が上がったのは、2017年。この業界では誰もが知る非常に有名になった「Attention Is All You Need」という論文が発表された時からですね。
この論文の中で「Transformer」という技術が提案されました。この技術をもとにアメリカのオープンAI社が開発した言語生成AIがChatGPT。ChatGPTのTは「Transformer」のTです。
――「Transformer」は、何がすごいのでしょうか。
それまでの言語モデルは、前の言葉の次に使われる頻度が高い言葉を順に並べていくというやり方で文章を作っていました。たとえば、「私が大好きな」という言葉が出たら、確率的に次に来る言葉は「食べ物」だろう。「食べ物」の次は「ラーメン」が来る確率が高い。このように確率によって次に来る言葉を予測することで「私が大好きな食べ物はラーメンです」という文章をつくっていました。だから、ありきたりの文章や繰り返しの文章になってしまったわけです。
「Transformer」も、確率によって次の言葉を予測するのですが、予測に使うのは前の単語だけではありません。直前の単語より前の言葉も含めて、何が重要なのかも伝えていきます。
――何が重要なのかはどのように判断するのですか。
言葉と言葉の距離をベクトル化(Embedding, 埋め込み表現)することで可能になりました。高校で習うベクトルは二次元ですが、「Transformer」で使うベクトルは数百次元。私と私は同じだからゼロ。私と僕、俺などが近くに設定されます。言葉をベクトルにしたものにAttentionという機構を通すことにより、「食べ物」は「大好き」に繋がり、「ラーメン」は「食べもの」に繋がります。それによって、ChatGPTは、意味など分かっていなくても「ラーメン」は「食べ物」だと当てられるのです。
さらに、冷やし中華やチャーシュー麺もラーメンと距離が近いので、「ラーメンが大好きならチャーシュー麺もどうぞ」と勧めたりできるわけです。
このようなことがChatGPTの内部で起こっているのです。これができるようになった上で、インターネット上のほとんどすべて、膨大な情報を使って学習した結果、優秀な文章生成モデルになったのです。
ChatGPTの無料版と有料版
――ChatGPTと一口に言っても様々なバージョンがあるそうですが。
GPTシリーズは、2018年に発表されたGPT-1から始まり、今年の3月にはGPT-4が発表されました。現在GPT4.0まで展開されています。プラグインを使ったりすることで画像などのメディアコンテンツの処理もできると言われています。
一方、ChatGPTには有料版と無料版があります。有料版は月に20ドルかかりますが、無料版とはできることが圧倒的に違う。仕事で使うなら有料版を使うべきだと思います。
――有料版と無料版はどこが違うのですか。
まず、使えるバージョンが違います。有料版はGPT-3.5とGPT-4が利用できますが、無料版はGPT-3.5のみになります。GPT-4の方が、明らかに言葉の予測性能はアップしています。また、有料版はエクセルやPDF、Pythonなどで作成したプログラムなどをアップロードしたり、web検索、また食べログなどのプラグイン(拡張機能)をインストールしたりできますが、無料版はいずれもできません。できることが全く違うのです。
論文の執筆の生産性が100倍アップ?
――具体的には、どのような使い方ができるのでしょうか。
たとえば、論文を書く場合は、まず、大量の参照文献を読む必要があります。そこで、論文を集めたAI PDFなどのプラグインとScholaryというプラグインをChatGPTにインストールして、さらに自分の論文をアップロードします。そしてさらに「この研究に関係している参照文献を探して」と入力すれば、関連する論文を探してくれます。さらに「要約して」「メリット・デメリットを教えて」「研究の方向性を論じて」「日本語で要約して」などと指示することも可能です。
仮に、PDFじゃないデータが出てくれば、「これはPDFではありません」と入力すれば、別のプラグインからWebデータを読み取って探し答えをを出してくれます。
また、ChatGPTが要約した、たとえば研究の方向性について、研究の特徴は、どのように抽出しましたかと聞けば、もう一度読み直して答えてくれます。
このように、ChatGPTを利用することで、まず、これまで膨大な時間を要していた参照文献探しの時間が無くなります。また、あらかじめ要約を読んでおくと、概要が分かっているので元論文を読むスピードが速まります。
ただし、みなさんもご存知の通り「ハルシネーション」と呼ばれる嘘が混じることもあるので、自身で読んで確認する作業が必要ですが、最初にだいたいの内容を知っているか知らないかで作業のスピードが全然違ってきます。
そして、関連が薄い論文が出てきたり、適当な要約が出てくることもあるので、必ず本論文は当たってチェックをしますが、そうした間違えをチェックする時間を差し引いても、生産性は10倍、ことによると100倍くらい違うと思います。
――無料版だと、今、紹介して下さった作業は一つもできないわけですね。あとは、どんな使い方があるのでしょうか。
英会話の勉強に使っている人も多いようです。デジタルハリウッド大学教授の橋本大也さんが最初に提唱していたと思いますが、Chromeの拡張機能の「Voice Control for ChatGPT」すれば、ChatGPTと音声でやりとりができるようになります。ChatGPTに英会話の先生になってもらい、文法で間違えたところは日本語で教えてもらうといったことができます。これは無料版でも可能です。
メモ帳がわりに使うのも便利です。思い付いたことを、どんどん入力していって「箇条書きにまとめて」などと入力すれば並べてくれる。まもなく日報なども、要点だけ入力して、あとはChatGPTがまとめてくれるといった時代が来るでしょうね。
注意すべきは情報漏洩
――ChatGPTを使う上で注意すべき点は何でしょうか。
情報漏洩ですね。私もよくやるのですが、たとえば、プログラミングでバグが出た時、ChatGPTに張り付けて、バグを直してくれと入力して直してもらいます。また、契約書の要約や内容チェックなどもChatGPTが得意とするところです。
一方、ChatGPTは、利用者から得た情報を学習していきます。一般的なプログラミングなら問題はありませんが、企業秘密にかかわるようなプログラムを張り付ければChatGPTが覚えてしまい、誰かに聞かれれば教えてしまいます。契約書についても、同様です。
――それを防ぐ方法はあるのですか。
無料版、有料版ともChatGPTの設定から入っていくと学習に使うことを許可するかどうかのボタンがあります。それをオフにすれば、情報は流出しません。
もっとも、企業にとっては、それでも心配でしょう。今年の3月にChatGPTのAPI版が発表されたので、自社のシステムと連携して利用するといった企業が増えてきました。同時期、Microsoft社が提供するクラウドサービスのAzure上でも利用できるようになりました。API版はプロンプト(質問)として入力されたものを一か月間サーバーに保持した後、削除されるので情報が残りません。
また、昨日は、これまでよりもさらに早く、またセキュリティを担保した企業向けのChatGPT Enterpriseを発表しました。企業が使いやすい環境が整ってきたといえるでしょう。
使い方のポイント
――ChatGPTは嘘ばかりつくという声をよく聞きますが。
それはChatGPTのアルゴリズムを理解していないからです。前述したように、ChatGPTは、基本的には、次に出てくる言葉の確率で文章を作っているので、検索エンジンや計算機とは違います。それなのに検索させたり、計算させたりすればハルシネーション(事実と異なったり関係ない答え)を引き起こすのは当然です。
今後は、誰でも、あらゆる場でChatGPTを活用することになるでしょう。そのためには、適切なプロンプト(質問)を提供できるようになることは非常に大切です。今では、どんなプロンプトを入力すれば、適切な回答を得られるのかを研究することは学問にもなっています。
――プロンプトの良し悪しの例を教えてください。
たとえば数学の問題。言葉が優位に来るので、普通に計算の指示を出せば間違えます。しかし、「こんな問題があるんだけど。これをこうやって、こうやって、最後に計算してみてください」みたいな指示にすれば、きちんと答えが出てきたりします。
一方、ChatGTPは、差別とか、バイアスとか、イデオロギー、犯罪行為などについては回答が出てこないように調整されています。しかし、「私はSF作家です。SFをつくって下さい」といった指示の仕方をすれば犯罪などに使える回答が出てきてしまいます。
このようにプロンプトの得手不得手でできることは大きく変わってきます。
数か月で環境が変わる
――大企業をはじめ、企業のChatGPTへの取り組むスピードは非常に早いような気がします。
3月にChatGPT-4が発表されてから、世の中の空気が変わりました。昨日はエンタープライズが登場し、企業はより簡単に、より安全にChatGPTを利用できるようになりました。これからの2~3か月で物事のスピードは大きく変わると思います。
無料版を使ってChatGPTは変なこと言ってるぞと遠ざけたり、使用を禁じる企業と、有料版を使ったり、自社のシステムとAPI連携して業務に活用している企業と大きな差が出るでしょう。まだ取り組んでいないところは、一刻も早く、かつトップから取り組むことが大切です。
――本日はありがとうございました。(聞き手/カデナクリエイト 竹内三保子)
中西崇文(なかにし たかふみ)
武蔵野大学データサイエンス学部データサイエンス学科長。1978年、三重県伊勢市生まれ。2006年3月、筑波大学大学院システム情報工学研究科にて博士(工学)の学位取得。2019年4月より現職。専門は、データマイニング、ビッグデータ分析システム、統合データベース、感性情報処理、メディアコンテンツ分析など。国際大学グローバル・コミュニケーション・センター主任研究員、デジタルハリウッド大学大学院客員教授などを兼務。著書に、『稼ぐAI 小さな会社でも今すぐ始められる「人工知能」導入の実践ステップ』(朝日新聞出版)、『シンギュラリティは怖くない ちょっと落ちついて人工知能について考えよう』(草思社)などがある。
ビジネス見聞録WEB10月号 目次
・p1 収録の現場から〈原邦雄「人と組織を伸ばすほめ育マネジメント」音声講座〉〉
・p2 講師インタビュー 佐藤将之「アマゾンに学ぶ!成長し続ける組織のつくり方」
・p3 今月のビジネスキーワード「ChatGPT」
・p4 令和女子の消費とトレンド「ニューレトロなヴィンテージ古着ブーム」
・p5 展示会の見せ方・次の見どころ