広告・課金・中毒設計を排除した、子どものための対話型アンビエント知能コンパニオン。AIペンダント・ルームカメラ・タブレットが連携し、生活習慣と発見を自然な会話で身につける。
┌─────────────────────────── 屋内 ─────────────────────────────────┐ │ │ │ [モコ] [AIペンダント] [ルームカメラ] │ │ タブレット 子どもが装着 各部屋に設置 │ │ ┌─────┐ ┌────────┐ ┌──────────┐ │ │ │ ^_^ │ │ Accel │ │ MediaPipe│ │ │ │ SVG │ │ HR/Temp│ │ 骨格検出 │ │ │ │ TTS │ │ Mic │ │ 表情分析 │ │ │ └──┬──┘ └───┬────┘ └────┬─────┘ │ │ │ │ │ │ │ ▼ ▼ ▼ │ │ ┌───────────────────────────────────────────────────────────┐ │ │ │ Orchestrator(中央統合エンジン) │ │ │ │ STT → Context → LLM → TTS → Lipsync → Avatar Render │ │ │ │ + Pendant Fusion + Camera Fusion │ │ │ │ + Health Engine + Safety Filter │ │ │ └───────────────────────────────────────────────────────────┘ │ └───────────────────────────────────────────────────────────────────┘
9つのシミュレーションシーン。各16〜18ステップの自然な会話フローで、ペンダントセンサーとカメラ分析のリアルタイムデータを含む。
18ノードのリアルタイムパイプライン。メイン処理チェーン、ペンダントAIセンサー、カメラ分析の3系統が並行動作し、Health Engineで統合判断。
デモでは各ステップの通信ペイロードを5タブで可視化。実際のAPIレスポンスと同等の模擬データを生成。
WebSocket通信フレーム
センサー生データ
顔・視線・表情分析
推論メタデータ
TTS出力・音素
9つのシーンをブラウザ上で再生するインタラクティブデモ。パイプライン可視化、データインスペクタ、リップシンク、再生速度制御を含む3カラムレイアウト。