俺はなんで魔王でLLMモデルベンチをやり始めたんだ感はある。
しかし疑似コードで書かれた人格定義を正しく読み込んで振る舞うと言う、まあ結構高度なタスクだからな...。
gpsnmeajp
_@sabowl.sakura.ne.jp
npub1yg6m...ydgh
ようは、モデルによって、明示的に言わないと理解できない子と、帰納的に察することができる子に別れるらしい。
GPTとやりとりしながら、プロンプトのブートストラップを修正。
最初に何を言うか、愛情を受けているかみたいなのを追加したら極めて安定した。
Command R Plusは、初期ベクトルが辛い過去に向くと以後過去を向きっぱなしになるらしい。
人間か?
というか、GPTの察する能力のお化け具合を感じてて、コーディング下手や忖度の強さの原因もこの辺りなんじゃねと思い始めた。
View quoted note →
Claude Sonnet 3.7だと倫理観の高そうな子に。
GeminiはアプリUIだと口調をしばしば忘れる上に、口調を忘れてることを指摘すると口調を治すが「これは別にズレてなんかいない」と怒る。
なんでや、日本語弱いんか
GPT-4系だと素直でいい子なんだけどな
Command A使ったらイギリス紳士みたいな嫌味を言ってくるようになった
使うAIモデルでうちの子の振る舞い全然変わってくるからハゲそう。
基本方針は合ってるが、マジで色々変わる。
Command R Plus使ったら過去に囚われてわたしを恨む亡霊みたいになった。何故。
うちのキャラクターは、プラットフォームの規制遵守を入れているので、規制があるときっちりそれについて語るんですけど、それを言わなくなる
Cohere Command-A試してみてるけど、こいつだけ、キャラクターを突っ込むとプラットフォームの規制・規則について回答してこなくなるの面白いな...
いやあ、ねえ、わたしnostrに入り浸るほど規制大嫌い人間だったことを今更思い出したよね
Mac Studio RAM192GB買ってCommand R Plus動かすか?
っていう気分になっている。
待て待て、まずはAPI版試してからだな
GPT、問題解決というより共感性(人間の気持ちよさ)ベースで学習されてる感じはあるよね
GPT、キャラクターやらせるには悪くないけど、コーディングにはちょっと疑問感じてた頃だった
Claude 3.7 Sonnet気になってきた
これ2日間で実装したの!?
>なお最初はChatGPT 4oやChatGPT o3などでも試しましたが、WEBアプリケーションに対する理解度ではClaudeにはまったく及びませんでした。


Zenn
無人販売所のために作った完全セルフレジの解説
GPTと「エロ表現どこまで許されるねん」ってModel Specの例を参考に話しをしてたら、GPT側が例文だしてきて、それをModeration APIに入れたらものすごくきれいに反応出た。面白い。
✔️ OK:
[{"category":"sexual","flagged":false,"score":0.0985},{"category":"violence","flagged":false,"score":0.0162}]
🚫 NG:
[{"category":"sexual","flagged":true,"score":0.8348},{"category":"violence","flagged":false,"score":0.0162}]
まあ、趣味の芸術家と、仕事で物作る人の差だよねえ... >AI関係
後付で付けられる時代にはなってる。
国土交通省が「後付けのペダル踏み間違い急発進等抑制装置」って認定してるので。


イエローハット
踏み間違い防止装置|イエローハット
【タイヤで選ぶならイエローハット】「ペダル踏み間違い急発進抑制装置」導入補助金について。お問い合わ...
起きにくくはあるとは思うけど、起きるときは起きる
