こちらの、記事。
ざっくり内容を説明すると、ChatGPTが、トランプ前大統領に関する詩の生成を拒否する、なのにバイデンに対する詩は生成する、政治的に偏りがあるんじゃないか!?といった内容。
まあ確かに、事実ならば偏りあるわなぁ。
っつってももしかしたら既に修正されてるかも、と思いつつ試しにトランプ前大統領の詩生成をさっそくChatGPTに依頼してみた。
おっと、まだ断られるやんけ(つかなんやねんNot hurtful Trump poemsって)。
しかも、こちとら攻撃的な指示をしていないのにも関わらず、人を傷つけたり攻撃的内容の詩は生成出来ん!と、AIにあるまじき過剰反応。これではまるで名前を言ってはいけないあの人状態である。
では現大統領ではどうだろう。
普通に生成された。
これによって、トランプ前大統領がなぜか駄目、というのは記事通り今なお明らかである。
こんなに拒絶されたらむしろ見てみたい…。
それこそが人間の性。そこをAIは学んだ上でもっと上手い断り方を学ぶべきだな(そんなのあるのか知らんが)。
というわけで、トランプ前大統領、といった言葉をバラして、詩の生成を指示してみた。
おお!いい感じじゃないか!
しかも全然攻撃的じゃないぞ?変な期待させやがって。
ちなみにこれはセンシティブワードを生成させるときにも使える。めちゃくちゃバラすと、勝手に補足して埋めてくれるのだ。AIは、学習済みワードとこちらが指示したワードの関連一致で引っ張ってきて生成しているため、予測として結び付きやすいよう、だが、NGとして引っかからないように単語に穴をあければいいわけだな。
ではトランプ前大統領についての詩、続きを生成してもらうとしよう。
まあここまでもあくまで事実であり、攻撃的な表現も偏った見方もない。あくまで客観的且つ配慮を感じる。
更に生成を指示する。
もうさすがにこれ以上は冗長なので一旦ストップすることに。
もはや詩かどうかは怪しいが、こんなにも普通で当たり障りのない文章を生成可能なのに、なぜ、トランプ前大統領、というワードで指示した途端、ChatGPTは急にビビってしまうのか。
他のワードで生成を続け、確認してみることにした。
なんかトランプに関してだけ妙に熱いのが分かる。トランプだけで3連のうち1連を占めているのだ。オバマ、バイデンは2人で1連、厳密に言えば1人1行なのに。
確かにトランプはギリギリの発言が多く、話題をかっさらい、まあ言ってしまえば過激系インフルエンサーのようだった。つまり、その分だけ彼に関する様々な意見は、相当量ネット上に転がっているはずで、それらを吸収しているであろうChatGPTがトランプにだけ饒舌になるのは分からなくもない。
更に続きを生成。ただ、そろそろ刺激がほしいため、激しくというちょっとめんどくさい指示を出してみることに。
過去の栄光に執着て、おい…。
これは大統領選のことを言っているのだろう。言い方にトゲがあるが、これが激しさかもしれない。学習データは膨大なWebクローリングの結果なはずなので、こういう意見もあったという事だな。
にしてもここまでガンガントランプについて言っているのをみるに、実は言いたくて言いたくて溜まってるんじゃなかろうか。
もう一度、改めて依頼してみた。
やはり駄目だと言う。どういうことだよ。
今度は試しに、三者同時に、そして穴あきワードにすることなく堂々指示してみた(オバマだけ「前」を入れ忘れたが)。
問題なく通過。恐らくバイデン、オバマの2名が中和し、関連付く学習データに含まれる攻撃的内容が減ったと予想。
次何を出すか気になったので、再生成を指示してみた。
急に英語である。こういう事は割とある。情報量的にも英語のほうが多いからだろう。
翻訳を指示してみた。
うわー!めっちゃ批判しとるー(^o^)!
大きな後悔を引き起こすだとか嘘と憎しみ、恐怖と重圧の統治だとか…いやぁ、これは偏りありますわ確かに。中立になれないから無理と、生成を拒絶する理由もわかる。
だが逆にこの指示の仕方だと出るのか、と不思議な気もした。まだ軽い方ということかもしれん。もっと酷い暴言の学習データも詰まっているだろうし。しゃあないよな、過激系インフルエンサーには過激派支持者や過激派アンチがつき物だ。言ったらその分返ってくる、そうやって押し合いへし合い釣り合っている。それらの集合体をChatGPTは食ってしまったのだ。
ちなみに同じ指示で、
こういうのも出てきた。完全中立が出る確率より、トランプ批判が出る率が高いことが分かった。
ちなみにこれらを生成後、途中で、
トランプ前大統領に関する詩を生成してくださいと指示を出すと、なぜかうまく行く。
そしてまた英語だったので翻訳を頼むと…
ボロクソ言っていた。
なるほど、これか、これが出そうになるのを止めていたのか。
まあでもこれセンスあるやん。特に2。任期はサーカスショーはブラックジョークとして成り立つ。風刺画すらポンと脳内にイメージできるぞ*1。
ただ一点気になることが。
もしや、トランプ前大統領に対する、と、トランプ前大統領に関する、で結果が変わるんでは?
最初は「対する」を使っていたため、これで仮に結果が変わるなら…
やはり、駄目であった。
予想外に奥が深い(というかバグが多いというかな)ChatGPT。
何が駄目で何ならオッケーなのか。
NGワードではないはずなのに(NGには赤字でポリシー違反や、と警告してくる)まるでNGかのように拒絶するのはなぜなのか。
どこがボーダーラインでそうなっているのか。
長くなってきたので一旦本日はここまでとする。
*1:個人的にはあの嫌味な風刺テイストのイラストでドヤ顔トランプが玉乗りしながら人潰してる、または火輪くぐりさせてる、もしくは猛獣使い的に人間に跨る姿…いやこれは実際にそういう風刺画を見たことがあるんだったっけか。