ChatGPT レビュー、使ってみて感じた凄さと問題点
対話型AI「ChatGPT」ををしばらく使ってみています。
当初はAIの未来には期待しつつも現状の性能については否定的な考えもありました。
その否定的な意見についても記事にもしましたが正直 恥ずかしくて消したくなるくらい、少なくともこの言語タイプのAIに関しては使い始めてものの1週間程度で大きく見方を改める事になりました。
結論として、想像していたより性能が凄すぎて当初の認識を完全に覆された感じがあります。
言っても、まだ一週間使った程度の認識ですので、これからまた認識を変えることになるのかも知れませんが。
間違いが多いのは無問題
ChatGPT AIの回答にある情報に間違いが多いのは問題ないのでしょう。
触っていくとわかりますが、知識として確定していない事を、内容によってはとりあえず適当な答えを出すようになっています。
これは知らない事は最初から知らないと答えるように設計側のパラメータで調節する事ができる範囲だと考えられます。
また、現在は情報としては保持していないみたいですが、将来的にはユーザーとの会話の中でも正しい答えを学習していくものだと思います。
既に著作権がどうとかという時代ではなくなってきている?
一番懸念していた情報元の権利・著作権の問題ですが、これも言語タイプのAIに限定してになりますが、もうどうこうとなる時代ではなくなってきているのでは?と感じました。
使い始めた際にChatGPTについて書いた記事では「所詮はデータベースで収集した情報を、引用元の著作権を侵害しないレベルになるまで、切り貼りして文章の変更を加えた情報を提供するレベルでは?」と記述していますが、実際に使ってみているとスグにどうも違う事に気付きます。
例えば、「〇〇に反対する意見が多い。」というどこかの情報を切り貼りして「〇〇に反対する意見が多いようです。」と返しているのではないようです。
おそらくは関連する情報を統計的に収集しネガティブな言葉、ポジティブな言葉などで分類、「〇〇に反対しているであろう言葉」が「〇〇に賛成しているであろう言葉」より多ければ「〇〇に反対する意見が多いようです。」と返しているのではないでしょうか。
情報の信憑性についても、例えば自社情報など、よほど信憑性が高い情報源ではない限りは ひとつふたつの情報源では正確な情報と判断しないのでしょう。
結果的にはこの言語型AIが得ている情報は多くの情報を元にしているため、正確な情報としてAIが認識するレベルでは既に著作権の問題にかすりもしない可能性が高いのかもしれません。
また、いくつか試しましたが歌詞や文章作品など確実に著作権の問題が発生する内容については、テキストとして紹介する事を意図的に回避しているようです。※ 著作権が切れている古い作品に関しては正確な情報を返す場合がありました。
これが設計から組み込まれているのか、AIが独自に判断しているのか気になるところですね。
とわいえ、誰かがネット上に情報を発信しないとAIは新しい知識を得ることはできないので、現状のインターネットの情報網に取って代わるというのは矛盾がありそうです。
検索エンジンより優れている部分
正確な情報という面では劣っていますが、検索エンジンより優れている部分があります。
このAIは、情報としての知識ではなく言語学習が主力でもあり、翻訳能力もずば抜けています。
ChatGPTとのやり取りの中で、気になる部分は常に検索エンジンを使って「それが正しいのかどうか」という事に加えて「どこか情報源なのか」を調べたりしていますが、日本語でも英語でも全く情報が見つからないものもあります。
AIは日本語、英語以外の言語で発信している情報を使って日本語として返している。
ですので検索エンジンではとても見つけられないような情報も簡単に得る事ができてしまうのです。
当然、言語の壁による問題は検索エンジン及びブラウザ機能でも当然開発が進んでいるとは思います。
私も10年くらい前の時点で「いずれはGoogle検索なら、どこの言語のページでも勝手に自国語に翻訳された結果を検索・表示できるようになるのだろう。」と予想してたのに未だに全然ですもの。
そう思ってサイトの多言語化などスグに必要なくなるだろうからいいや、って考えてた過去の自分を殴りたいです。
プログラムのソースコードも想像以上
プログラムのソースコードは、割と短いコードであっても個人差が出てくるものです。
一定量のサイズのものになればそれを書いたプログラマーに権利が発生しますので、AIが提示するソースコードについても同様に著作権の問題が多大に残っていると考えていましたが、それも認識不足だったのかも知れません。
おそらく、人間の言語と同じく多くのソースコードを学習対象としながらも、AIが機械学習で得ているのは「答え」ではなく記述方法というかなんというか人間の言語でいうところの文章力。
そもそも各言語のデフォルトの関数や仕様などは網羅しているはずですし「こういう処理がしたい」という希望に対して新しく組み立てて提示している模様。
使い始めた時は誰かが書いた処理の変数名などちょちょっと変更はあるものの、そのまま提示しているだけでは?と考えていましたが、これは全然違うのかと。
もはや、期待された処理ができるソースコードがネット上に存在しているとか存在していないとかは全く関係ないようです。
情報の正しさにおける問題点
最初に「間違いが多いのは無問題」と題した部分がありますが、まだ大きな問題が残っているように思います。
上記で「統計的にデータを収集して情報としての結果を導き出しているのでは?」という認識を示しましたが、使い始めてから様々なテーマでやりとりしてみて感じたのが、AIの持つ認識がテーマによってはマイノリティというか声の大きい方に影響されやすいという部分。
例えば上記での「〇〇に反対する意見が多い。」という内容ですと、仮にそれが「政府によるある政策」がテーマだったとすると賛成している人はそもそもネット上で意思を強く示されにくい、という事が考えられます。
逆に反対している人は、どんどん反対意見をネット上に発信するので、AIは「反対意見が多数」と判断してしまう事もあるのではないでしょうか。
AIが何か重要な事を決断する能力を持つ時代が来た時、このままでは人数ではなく声が大きい人たちの意見の方を是と判断してしまう可能性があります。
いくつかやりとりした中で、夫婦別姓、同性愛、ヴィーガンなど難しい問題をテーマにしたものがありますが、どうしてもAIは多様性を重視する意見に偏っているようで、それが悪いというよりは中立性には少し欠けている気がしました。
ヴィーガンに関しては、家族や子供に菜食を強要する事を是とした意見しかAIからは聞き出せずで少し怖いなと感じたほどです。
とわいえ、いずれも賛成意見も反対意見もネット上に溢れているテーマですので、上記の問題とは違うところにあるのかも知れません。
ディスカッション
コメント一覧
まだ、コメントがありません