はじめに

概要

AITuberKitは、誰でも簡単にAIキャラクターとチャットできるWebアプリケーションを構築できるオープンソースのツールキットです。AIキャラクターとの対話機能とAITuber配信機能を中心に、様々な拡張機能を備えています。

主な機能

1. AIキャラとの対話

各種LLMのAPIキーを使って、AIキャラクターと簡単に会話できます
マルチモーダル対応で、カメラからの映像やアップロードした画像を認識して回答を生成
直近の会話文を記憶として保持

2. AITuber配信

YouTubeの配信コメントを取得して、AIキャラクターが自動で応答
会話継続モードでコメントがなくても自発的に発言可能
"#"から始まるコメントは読まれない機能

3. その他の機能

外部連携モード: WebSocketでサーバーアプリと連携し、より高度な機能を実現
スライドモード: AIキャラクターがスライドを自動で発表するモード
Realtime APIモード: OpenAIのRealtime APIを使用した低遅延対話と関数実行
人感検知モード: カメラによる顔検出で来場者を自動検知し、挨拶・応答を実行
アイドルモード: 入力がない間もキャラクターが自動的に発話
デモ端末モード: 展示会やデジタルサイネージ向けの入力制限・NGワードフィルタ・パスコード保護

対応キャラクターモデル

3Dモデル: VRMファイル
2Dモデル: Live2Dファイル（Cubism 3以降）
PNGTuber: PNG画像ベースのキャラクター

対応LLM

OpenAI
Anthropic
Google Gemini
Azure OpenAI
xAI
Groq
Cohere
Mistral AI
Perplexity
Fireworks
DeepSeek
OpenRouter
ローカルLLM
Dify

対応音声合成エンジン

VOICEVOX
Koeiromap
Google Text-to-Speech
Style-Bert-VITS2
AivisSpeech
Aivis Cloud API
GSVI TTS
ElevenLabs
Cartesia
OpenAI
Azure OpenAI

動作要件

Node.js: 24.x
npm: ^11.6.2

セキュリティに関する注意事項

このリポジトリは、個人利用やローカル環境での開発はもちろん、適切なセキュリティ対策を施した上での商用利用も想定しています。ただし、Web環境にデプロイする際は以下の点にご注意ください：

APIキーの取り扱い: バックエンドサーバーを経由してAIサービス（OpenAI, Anthropic等）やTTSサービスのAPIを呼び出す仕様となっているため、APIキーの適切な管理が必要です。

本番環境での利用について

本番環境で利用する場合は、以下のいずれかの対応を推奨します：

バックエンドサーバーの実装: APIキーの管理をサーバーサイドで行い、クライアントからの直接的なAPIアクセスを避ける
利用者への適切な説明: 各利用者が自身のAPIキーを使用する場合は、セキュリティ上の注意点について説明する
アクセス制限の実装: 必要に応じて、適切な認証・認可の仕組みを実装する

サポートとコミュニティ

ライセンス

本プロジェクトは、バージョン v2.0.0 以降、カスタムライセンスを採用しています。詳細はライセンスページをご確認ください。

本ドキュメントはv2.42.0に対応しています