話すペット動画を作るには、犬や猫などの顔がはっきり見える写真を用意し、短い一人称の台本を書き、声と感情を選んで、リップシンクされたクリップを生成します。最後に字幕を入れて投稿しやすく整えます。
よい話すペット動画はシンプルです。ペットがひとつの考えを話し、声が性格に合い、動きが小さいので元のペットらしさが残ります。
強いクリップはたいてい短めです。夕食に文句を言う犬、部屋を評価する猫、誕生日メッセージを届けるペットなら、5〜15秒でも十分伝わります。長い台詞は口の動きが不自然に見えやすくなります。
目的は「動物に何でもさせる」ことではありません。「1枚の写真に1行をうまく話させる」ことです。この形なら、Reels、TikTok、Shorts、誕生日動画、保護ペットの近況、ペットインフルエンサー投稿に使いやすくなります。
静止したペット写真を話させたいときは、DomoAI Talking Avatarを使います。写真をアップロードし、台本と声を選び、アクションプロンプトを追加して動画を生成します。
すぐ始めたい場合は、Talking Avatar quick appが近道です。話す動画とは別に動きを加えたい場合は、生成後に画像アニメーションも使えます。
ペットがカメラを向いていて、目と口まわりが見える写真を選びます。背景が頭や耳に重ならないものが理想です。
よい元画像の条件:
横顔でもかわいく見えることはありますが、話す動きに必要な情報が少なくなります。強い影、開きすぎた口、口元を覆う毛も不安定さの原因になります。
ペット本人が話しているように、一人称で短く書きます。長い説明より、ひとつの小さな意見のほうが伝わります。
使いやすい台詞例:
SNS用なら8〜20語程度を目安にします。短い台詞のほうが口の動きが合わせやすく、字幕でも読みやすくなります。
DomoAI Talking Avatarは、声の選択、アップロード音声からのボイスクローン、6種類の感情設定、6種類の声のトーン、多言語に対応しています。台本を入力することも、音声をアップロードすることもできます。対応音声形式はMP3、WAV、M4Aで、最大80MBです。
声はペットのキャラクターに合わせます。小さな犬なら明るく少しそわそわした声、眠そうな猫なら落ち着いた皮肉っぽい声、大きな老犬なら温かくゆっくりした声が合います。
1本の動画では感情をひとつに絞ります。「楽しい」「ドラマチック」「落ち着いた」「困惑した」のように明確にすると、表情がまとまりやすくなります。
アクションプロンプトは表情を支えます。動きは小さく具体的にします。顔が台詞を助けるのが目的で、台詞より目立つ必要はありません。
そのまま使えるプロンプト:
happy expression, small head tilt, natural blink, subtle mouth movement, bright eyes.
calm dramatic expression, tiny ear movement, slow blink, gentle mouth movement, steady face.
curious look, slight head tilt, soft eyes, natural lip movement, no large body motion.
話すポートレートの中でジャンプ、ダンス、走る動き、大きな全身動作を求めるのは避けましょう。体の動きが必要な場合は、別クリップとしてDomoAI Image to Videoを使うか、話さない場面にImage Animationを使います。
生成後は視聴者の目線で確認します。口元、目の動き、字幕スペース、最初の1秒を見ます。違和感がある場合は、台本やアクションプロンプトを簡単にします。
SNSでは音なしで見られることが多いので、字幕を入れます。重要な台詞は大きく表示し、ペットの口元に重ならない位置に置きます。
Talking Avatarの中では背景音楽を直接追加できません。MP4を書き出してから、CapCut、Premiere Pro、DaVinci Resolve、Canva、各SNSアプリで音楽、効果音、字幕、縦横比を仕上げます。
仕上げたいクリップが決まったら、DomoAI Video Upscalerで画質を上げます。弱い元画像を直すより、よい動きのクリップを磨くために使うのが向いています。
| ワークフロー | 向いている場面 | DomoAIの機能 | 注意点 |
|---|---|---|---|
| 話すペット動画 | 1枚の写真に短い台詞を話させたい | Talking Avatar | 顔が見える写真と短い台本が必要 |
| 録音済みの声 | 音声やクローン音声がある | AI Video Lip Sync | 音声が明瞭なほど口の動きが合いやすい |
| 話さない動き | まばたきや首の動きを加えたい | Image Animation | 大きな動きは歪みやすい |
| 写真アニメーション | 静止画を広く動画化したい | DomoAI Image to Video | 話すクリップとは分けて使う |
| 最終仕上げ | 大きな画面でもきれいに見せたい | Video Upscaler | 動きが気に入ってから使う |
| ペット | 台詞 | 声の方向性 | アクションプロンプト |
|---|---|---|---|
| 犬 | 「散歩はよかった。でも短すぎました。」 | 温かく少しドラマチック | 明るい目、小さな首かしげ、自然なまばたき |
| 猫 | 「邪魔だったので落としました。」 | 落ち着いた自信のある声 | ゆっくりしたまばたき、小さな耳の動き |
| 子犬 | 「反省はしていません。あと、おやつください。」 | 明るく遊び心のある声 | 元気な目、小さな笑顔、控えめな口の動き |
| シニアペット | 「夕食まで、私は十分待ちました。」 | やさしくゆっくり | 柔らかい表情、落ち着いたまばたき |
| 誕生日ペット | 「誕生日おめでとう。一口だけ残しました。」 | 明るく温かい声 | うれしそうな表情、小さな首かしげ |
これらを出発点にして、ペットの名前、好きな食べ物、よくする癖、視聴者が知っているネタを入れ替えます。
口元が不自然な場合は、まず台詞を短くします。複雑な文より5語程度のジョークのほうが安定することがあります。
別の動物のように見える場合は、より鮮明な写真を選びます。強いフィルター、広角の歪み、暗い写真、顔が隠れた写真は避けます。
表情が強すぎる場合は、感情表現を減らします。「happy expression」は「super excited, shocked, laughing, and surprised」より扱いやすい指示です。
ジョークが伝わらない場合は、字幕と前振りを追加します。たとえば、ペットが話す前に「おやつ袋の音がしたとき」と表示します。
本物の動物行動のように見える場合は、AIで作ったことが分かる文脈にします。リアルなペットショート、保護ストーリー、健康に関する内容では特に大切です。
SNS向けの編集アイデアは、DomoAIの写真コンテンツをSNS向けにアニメーション化するガイドも参考になります。別の制作シーンを探す場合は、DomoAI Make hubも使えます。
はい。顔がはっきり見えるペット写真、短い台本、声、感情を使うと、Talking Avatar風のクリップを作れます。正面写真が最も使いやすいです。
顔が見える、明るくシャープな写真です。横顔、隠れた口元、強い影、ブレ、複雑な背景は避けます。
はい。DomoAIはアップロード音声からのボイスクローンに対応し、MP3、WAV、M4Aを最大80MBまで受け付けます。
よくある原因は、写真のブレ、横向きの顔、長すぎる台詞、大げさな動きの指示、毛やおもちゃで隠れた口元です。
はい。字幕を加え、平台に合わせてトリミングし、誤解される可能性がある場合はAI生成であることが分かるようにします。
いいえ。まず話すペット動画を生成し、外部エディターで音楽、効果音、字幕を追加します。
Make every scene
worth sharing.