Skip to content

はじめに

概要

AITuberKitは、誰でも簡単にAIキャラクターとチャットできるWebアプリケーションを構築できるオープンソースのツールキットです。AIキャラクターとの対話機能とAITuber配信機能を中心に、様々な拡張機能を備えています。

主な機能

1. AIキャラとの対話

  • 各種LLMのAPIキーを使って、AIキャラクターと簡単に会話できます
  • マルチモーダル対応で、カメラからの映像やアップロードした画像を認識して回答を生成
  • 直近の会話文を記憶として保持

2. AITuber配信

  • YouTubeの配信コメントを取得して、AIキャラクターが自動で応答
  • 会話継続モードでコメントがなくても自発的に発言可能
  • "#"から始まるコメントは読まれない機能

3. その他の機能

  • 外部連携モード: WebSocketでサーバーアプリと連携し、より高度な機能を実現
  • スライドモード: AIキャラクターがスライドを自動で発表するモード
  • Realtime APIモード: OpenAIのRealtime APIを使用した低遅延対話と関数実行
  • 人感検知モード: カメラによる顔検出で来場者を自動検知し、挨拶・応答を実行
  • アイドルモード: 入力がない間もキャラクターが自動的に発話
  • デモ端末モード: 展示会やデジタルサイネージ向けの入力制限・NGワードフィルタ・パスコード保護

対応キャラクターモデル

  • 3Dモデル: VRMファイル
  • 2Dモデル: Live2Dファイル(Cubism 3以降)
  • PNGTuber: PNG画像ベースのキャラクター

対応LLM

  • OpenAI
  • Anthropic
  • Google Gemini
  • Azure OpenAI
  • xAI
  • Groq
  • Cohere
  • Mistral AI
  • Perplexity
  • Fireworks
  • DeepSeek
  • OpenRouter
  • ローカルLLM
  • Dify

対応音声合成エンジン

  • VOICEVOX
  • Koeiromap
  • Google Text-to-Speech
  • Style-Bert-VITS2
  • AivisSpeech
  • Aivis Cloud API
  • GSVI TTS
  • ElevenLabs
  • Cartesia
  • OpenAI
  • Azure OpenAI

動作要件

  • Node.js: 24.x
  • npm: ^11.6.2

セキュリティに関する注意事項

このリポジトリは、個人利用やローカル環境での開発はもちろん、適切なセキュリティ対策を施した上での商用利用も想定しています。ただし、Web環境にデプロイする際は以下の点にご注意ください:

  • APIキーの取り扱い: バックエンドサーバーを経由してAIサービス(OpenAI, Anthropic等)やTTSサービスのAPIを呼び出す仕様となっているため、APIキーの適切な管理が必要です。

本番環境での利用について

本番環境で利用する場合は、以下のいずれかの対応を推奨します:

  1. バックエンドサーバーの実装: APIキーの管理をサーバーサイドで行い、クライアントからの直接的なAPIアクセスを避ける
  2. 利用者への適切な説明: 各利用者が自身のAPIキーを使用する場合は、セキュリティ上の注意点について説明する
  3. アクセス制限の実装: 必要に応じて、適切な認証・認可の仕組みを実装する

サポートとコミュニティ

ライセンス

本プロジェクトは、バージョン v2.0.0 以降、カスタムライセンスを採用しています。詳細はライセンスページをご確認ください。

本ドキュメントはv2.42.0に対応しています