ChatGPT o1やo1 proの意外な欠点見つけたった

おーぷん2ちゃんねる

47: 名無しさん@お腹いっぱい。 2024/12/26(木) 03:37:43.04 ID:D2Z+lFWY
o1やo1 proの意外な欠点見つけた
なまじAIが賢いからこそユーザーがAIの出力に引っ張られる現象が起きやすい
分かりづらい例えだが現代文の試験の間違った選択肢に釣られるパターンに似てる
微妙な違和感を感じつつもそれを言語化できずAIのズレた回答を受け入れてしまう落とし穴がある

48: 名無しさん@お腹いっぱい。 2024/12/26(木) 03:47:48.51 ID:ySUR+ns2
AIって直前の回答をど忘れするくせにこっちが提示した誤解だけは引き継いでくるのなんなんだろうな

49: 名無しさん@お腹いっぱい。 2024/12/26(木) 04:05:38.07 ID:pY1mJUhv
o1シリーズはそれまでのLLMと仕様を変えたから露骨に性能上がったが
GeminiとかClaudeは従来のLLMのままどこまで性能上げられるんだろうな(Geminiはo1の真似し始めたけど)
LLMの改良の先にAGIがあるのか?それとも基礎研究は今しててその繋ぎに改良してユーザー留めておこうとしてるのか?

54: 名無しさん@お腹いっぱい。 2024/12/26(木) 09:32:19.55 ID:2blcQ7dD
ChatGPT Searchしばらく使ってみたけど俺の使い方だとPerplexityのほうが欲しい情報くれるなあ
ChatGPTならではの使い方とかあるのだろうか

55: 名無しさん@お腹いっぱい。 2024/12/26(木) 09:54:50.77 ID:ZydUoUhx
Perplexityも変な制約でソースを出さなかったりソースを読まなかったりする
リートンはあまりそういうことはない

56: 名無しさん@お腹いっぱい。 2024/12/26(木) 11:42:58.24 ID:LEWK8ieR
検索した結果を使って色々作業させられるとか?あと一つのチャット内の記憶力的にChatGPTの方が良いかも
単発検索ならPerplexityかFeloの方が優秀だと思う

161: 名無しさん@お腹いっぱい。 2024/12/27(金) 21:25:18.31 ID:GdK6IqkS
結局ベースモデルの性能が上がらないことには翻訳は良くならないんだよな
4oとo1だと翻訳能力はあまり変わらないらしいし
はやく思想書レベルの英文をプロレベルで訳せる段階になってくれ

167: 名無しさん@お腹いっぱい。 2024/12/27(金) 23:57:55.82 ID:pJhAQGlW
>>161
プロレベルというが現状プロが訳した文章でも原文と照らし合わせたほうがわかりやすいこともままあるからな
翻訳という技法の限界

176: 名無しさん@お腹いっぱい。 2024/12/28(土) 03:39:44.79 ID:gnyv8ntl
>>167
まあプロといってもピンキリで読みにくいカチコチの直訳とかは金返せと言いたくなる
最近読んだ中ではゴーイングダークって本が酷かったな
4oはそのレベルはすでに超えていて文脈を考慮して意訳もしてくれるんだけど
どうしても2割ほど誤訳や不十分な訳が残ってしまうから人力で直さざるを得ない
そこさえなくなれば最高なんだけど

元スレ
https://toro.2ch.sc/test/read.cgi/esite/1735123082/

コメント