Back to Skills
inference-sh376Content Management

Génération de vidéos par IA

Générez des vidéos IA avec l'interface CLI inference.sh en utilisant plus de 40 modèles (Veo, Seedance, Wan, Grok, etc.), prenant en charge la génération texte-vers-vidéo, image-vers-vidéo, les avatars virtuels/lipsync, la super-résolution vidéo et les effets sonores.

Installation Commandexplicit
$ npx skills add https://github.com/infsh-skills/skills --skill ai-video-generation
Génération de vidéos par IA

À propos

Générez des vidéos IA en utilisant plus de 40 modèles via l'interface CLI inference.sh. Prend en charge la génération texte-vers-vidéo, image-vers-vidéo, les avatars virtuels, le lipsync, la super-résolution vidéo et les effets sonores. Convient pour les réseaux sociaux, le marketing, les vidéos explicatives, les démonstrations de produits et les avatars IA.

Fonctionnalités principales

  • Plus de 40 modèles vidéo, dont Google Veo 3.1/3, Seedance, Wan 2.5, Grok Imagine Video, OmniHuman et P-Video
  • Génération texte-vers-vidéo et image-vers-vidéo avec prompts et paramètres configurables
  • Animation d'avatar et fonctionnalité de lipsync réaliste
  • Super-résolution vidéo, effets sonores et fusion de médias avec transitions
  • Intégration via la CLI belt avec suivi de progression en temps réel et streaming
  • Routage des modèles et exemples, supportant des workflows rapides/économiques ou haute qualité

Cas d'utilisation

  • Créer des vidéos courtes pour réseaux sociaux, du contenu marketing et des démonstrations de produits
  • Générer des avatars IA et du contenu d'interview personnalisé à partir d'images + audio
  • Produire des animations texte-vers-vidéo ou image-vers-vidéo pour vidéos explicatives et prototypes
  • Améliorer des vidéos existantes avec super-résolution et effets sonores

Installation

SKILL.md

---
name: ai-video-generation
description: "Generate AI videos with Google Veo, Seedance, Wan, Grok and 40+ models via inference.sh CLI. Models: Veo 3.1, Veo 3, Seedance 1.5 Pro, Wan 2.5, Grok Imagine Video, OmniHuman, Fabric, HunyuanVideo. Capabilities: text-to-video, image-to-video, lipsync, avatar animation, video upscaling, foley sound. Use for: social media videos, marketing content, explainer videos, product demos, AI avatars. Triggers: video generation, ai video, text to video, image to video, veo, animate image, video from image, ai animation, video generator, generate video, t2v, i2v, ai video maker, create video with ai, runway alternative, pika alternative, sora alternative, kling alternative"
allowed-tools: Bash(belt *)
---

# AI Video Generation

Generate videos with 40+ AI models via [inference.sh](https://inference.sh) CLI.

![AI Video Generation](https://cloud.inference.sh/app/files/u/4mg21r6ta37mpaz6ktzwtt8krr/01kg2c0egyg243mnyth4y6g51q.jpeg)

## Quick Start

> Requires inference.sh CLI (`belt`). [Install instructions](https://raw.githubusercontent.com/inference-sh/skills/refs/heads/main/cli-install.md)

```bash
belt login

# Generate a video with Veo
belt app run google/veo-3-1-fast --input '{"prompt": "drone shot flying over a forest"}'
```

## Available Models

### Text-to-Video

| Model | App ID | Best For |
|-------|--------|----------|
| Veo 3.1 Fast | `google/veo-3-1-fast` | Fast, with optional audio |
| Veo 3.1 | `google/veo-3-1` | Best quality, frame interpolation |
| Veo 3 | `google/veo-3` | High quality with audio |
| Veo 3 Fast | `google/veo-3-fast` | Fast with audio |
| Veo 2 | `google/veo-2` | Realistic videos |
| **P-Video** | `pruna/p-video` | Fast, economical, with audio support |
| **WAN-T2V** | `pruna/wan-t2v` | Economical 480p/720p |
| Grok Video | `xai/grok-imagine-video` | xAI, configurable duration |
| Seedance 1.5 Pro | `bytedance/seedance-1-5-pro` | With first-frame control |
| Seedance 1.0 Pro | `bytedance/seedance-1-0-pro` | Up to 1080p |

### Image-to-Video

| Model | App ID | Best For |
|-------|--------|----------|
| Wan 2.5 | `falai/wan-2-5` | Animate any image |
| Wan 2.5 I2V | `falai/wan-2-5-i2v` | High quality i2v |
| **WAN-I2V** | `pruna/wan-i2v` | Economical 480p/720p |
| **P-Video** | `pruna/p-video` | Fast i2v with audio |
| Seedance Lite | `bytedance/seedance-1-0-lite` | Lightweight 720p |

### Avatar / Lipsync

| Model | App ID | Best For |
|-------|--------|----------|
| OmniHuman 1.5 | `bytedance/omnihuman-1-5` | Multi-character |
| OmniHuman 1.0 | `bytedance/omnihuman-1-0` | Single character |
| Fabric 1.0 | `falai/fabric-1-0` | Image talks with lipsync |
| PixVerse Lipsync | `falai/pixverse-lipsync` | Realistic lipsync |

### Utilities

| Tool | App ID | Description |
|------|--------|-------------|
| HunyuanVideo Foley | `infsh/hunyuanvideo-foley` | Add sound effects to video |
| Topaz Upscaler | `falai/topaz-video-upscaler` | Upscale video quality |
| Media Merger | `infsh/media-merger` | Merge videos with transitions |

## Browse All Video Apps

```bash
belt app list --category video
```

## Examples

### Text-to-Video with Veo

```bash
belt app run google/veo-3-1-fast --input '{
  "prompt": "A timelapse of a flower blooming in a garden"
}'
```

### Grok Video

```bash
belt app run xai/grok-imagine-video --input '{
  "prompt": "Waves crashing on a beach at sunset",
  "duration": 5
}'
```

### Image-to-Video with Wan 2.5

```bash
belt app run falai/wan-2-5 --input '{
  "image_url": "https://your-image.jpg"
}'
```

### AI Avatar / Talking Head

```bash
belt app run bytedance/omnihuman-1-5 --input '{
  "image_url": "https://portrait.jpg",
  "audio_url": "https://speech.mp3"
}'
```

### Fabric Lipsync

```bash
belt app run falai/fabric-1-0 --input '{
  "image_url": "https://face.jpg",
  "audio_url": "https://audio.mp3"
}'
```

### PixVerse Lipsync

```bash
belt app run falai/pixverse-lipsync --input '{
  "image_url": "https://portrait.jpg",
  "audio_url": "https://speech.mp3"
}'
```

### Video Upscaling

```bash
belt app run falai/topaz-video-upscaler --input '{"video_url": "https://..."}'
```

### Add Sound Effects (Foley)

```bash
belt app run infsh/hunyuanvideo-foley --input '{
  "video_url": "https://silent-video.mp4",
  "prompt": "footsteps on gravel, birds chirping"
}'
```

### Merge Videos

```bash
belt app run infsh/media-merger --input '{
  "videos": ["https://clip1.mp4", "https://clip2.mp4"],
  "transition": "fade"
}'
```

## Related Skills

```bash
# Full platform skill (all 250+ apps)
npx skills add inference-sh/skills@infsh-cli

# Pruna P-Video (fast & economical)
npx skills add inference-sh/skills@p-video

# Google Veo specific
npx skills add inference-sh/skills@google-veo

# AI avatars & lipsync
npx skills add inference-sh/skills@ai-avatar-video

# Text-to-speech (for video narration)
npx skills add inference-sh/skills@text-to-speech

# Image generation (for image-to-video)
npx skills add inference-sh/skills@ai-image-generation

# Twitter (post videos)
npx skills add inference-sh/skills@twitter-automation
```

Browse all apps: `belt app list`

## Documentation

- [Running Apps](https://inference.sh/docs/apps/running) - How to run apps via CLI
- [Streaming Results](https://inference.sh/docs/api/sdk/streaming) - Real-time progress updates
- [Content Pipeline Example](https://inference.sh/docs/examples/content-pipeline) - Building media workflows

Related Skills

More workflow tools in the Content Management category.

View all skills →

Compatible MCP Servers

Power these skills with protocol-compliant data sources.

Explore servers →