
Limaiの頭脳
統合LLMトレーニングシステム
0総学習イベント
教師あり学習 (Supervised Fine-Tuning)
入力→出力ペアで直接学習
マルコフ連鎖学習
文章から単語の繋がりを自動学習
💡 長い文章ほど自然な応答が可能に
RLHF (人間のフィードバックから学習)
応答を評価して品質を向上
1. 会話する
→
2. 👍/👎で評価
→
3. 改善を提案
→
4. 学習完了!
KTO (Kahneman-Tversky Optimization)
単一評価から効率的に学習 - ペアデータ不要
👍 良い応答として記録 → 似た応答を優先
👎 悪い応答として記録 → 似た応答を避ける
⚡ チャットで応答を評価すると自動的にKTO学習が適用されます
DPO (Direct Preference Optimization)
比較評価で好みを直接学習
チャットで「比較して」と言うと、DPO比較モードを開始できます
ニューラルネットワーク (Pure Lisp実装)
深層学習でカテゴリ分類
★ Limaiの成長 ★
Lv.1
読み込み中...
テレパシー精度: 0%
トレーニング概要
SFT0ペア
Markov0単語
RLHF0評価
KTO0更新
DPO0比較
NN0語彙
🔗 統合アーキテクチャ
入力テキスト
↓
NN分類
↓
Markov生成
↓
SFT参照
↓
RLHF/KTO/DPO調整
↓
最終応答
📊 基本統計
700会話数
571訪問者
8368辞書サイズ