Information

Latest AI News

Explore AI Frontiers, Master Industry Trends

AI Daily Brief

Your Daily AI Brief - Never Miss What's Next

Information

AI Product Finder

Smart Product Discovery - Comprehensive Market Intelligence

AI Product Rankings

AI Product Power Rankings - Performance, Buzz & Trends

AI Product Submit

Submit Your AI Product - Amplify Reach & Drive Growth

Tools

AI Tools Directory

Discover The Best AI Websites & Tools

Information

AI Models Finder

Comprehensive AI Models Collection for All Your Development & Research Needs

LLM Leaderboard

AI LLM Power Rankings - Performance, Buzz & Trends

Model Providers

Discover Trusted AI Model Partners - Guaranteed Reliable Support

Tools

Compare LLMs

Multi-Dimensional Large Model Comparison - Find Your Perfect Match

LLM Cost Calculator

Calculate AI Model Costs Accurately - Optimize Your Budget

LLM Arena

Multi-Model Real-Time Evaluation & Quick Output Comparison

Information

MCP Servers

Discover Popular AI-MCP Services - Find Your Perfect Match Instantly

MCP Client

Easy MCP Client Integration - Access Powerful AI Capabilities

MCP Case Tutorials

Master MCP Usage - From Beginner to Expert

MCP Ranking

Top MCP Service Performance Rankings - Find Your Best Choice

MCP Service Submission

Publish & Promote Your MCP Services

Tools

MCP Playground

Test MCP Services Freely - Quick Online Experience

MCP Inspector

Quick MCP Service Testing - Fast Deployment

Tools

AI Brand Monitoring Tool

Analyze & Track How AI Models Cite Your Brand

AI Search Visibility Checker

Detect brand's visibility on AI platforms

Service

GEO Services

Achieve Dominant Visibility in AI Search for Your Business or Brand with GEO Services

Tools

AI Model Compatibility Checker

Free PC Hardware Test for DeepSeek & Llama

AI Deployment Calculator

Enter Your Large Model Computing Requirements for Instant GPU, Memory & Server Configuration Recommendations

AI Tutorial

Révolution des audios narrés par l'IA ! Doubao propose un système de double voice automatique pour plusieurs personnages avec un taux d'identification des personnages de 98 %, à la hauteur des dramatiques radiophoniques professionnels

AIbase基地

Publié leActualités IA · 5 minutes de lecture · Oct 29, 2025

Lorsque l'IA ne peut pas seulement "lire" un roman, mais aussi diriger une pièce radiophonique à plusieurs personnages pleine d'émotions et bien définie, l'industrie des contenus audio connaît un tournant révolutionnaire. Récemment, l'équipe de Doudou Voice a lancé officiellement une solution complète pour la production automatique de pièces radiophoniques à plusieurs personnages, réalisant pour la première fois une fabrication entièrement automatisée, du texte original d'un roman jusqu'au produit final de la pièce radiophonique : sans acteurs de doublage, sans montage postérieur, sans intervention humaine, les coûts chutent brutalement et l'efficacité augmente considérablement, tout en offrant un résultat qui approche le niveau professionnel des pièces radiophoniques.

Un taux d'identification des personnages de 98 %, l'IA « joue » l'âme des personnages

La percée principale de cette solution réside dans son moteur de synthèse vocale à plusieurs personnages naturelle. Grâce à une pré-formation multimodale sur un grand nombre de textes de romans et de données vocales, l'IA peut non seulement distinguer précisément les différents personnages dans les dialogues, avec un taux de précision supérieur à 98 %, mais aussi attribuer à chaque personnage une intonation, un rythme et un ton adaptés à leur caractère, à leurs émotions et à leur situation. Que ce soit le rire sombre d'un méchant froid ou l'enthousiasme léger d'une héroïne, l'IA sait les interpréter subtilement, éliminant ainsi le sentiment mécanique typique des TTS traditionnels où un seul voix est utilisé pour tous les personnages.

De plus, le système peut ajouter intelligemment de la musique d'arrière-plan, des effets sonores environnementaux et des effets de transition : une bataille sous la pluie accompagnée de grondements de tonnerre et de résonances de pas, des dialogues dans un palais avec des sons de harpe ancienne et des crépitements de bougies, créant ainsi une expérience auditive immersive de qualité cinéma.

Tomato Novel applique la technologie en premier, la réaction des utilisateurs dépasse les attentes

Cette technologie a été déployée commercialement pour la première fois dans l'application Tomato Novel appartenant à ByteDance. Les premières pièces radiophoniques générées par l'IA ont reçu rapidement des retours enthousiastes des lecteurs : « C'est comme si on écoutait une pièce radiophonique produite par une équipe professionnelle de doublage » « Le changement de personnage est parfaitement naturel » « La vitesse de mise à jour est dix fois plus rapide que celle de l'humain ». Cela a non seulement considérablement enrichi l'offre de contenu de la plateforme, mais a également permis aux nombreux romans de moyenne longueur d'accéder pour la première fois à une version audio de qualité.

De « audible » à « agréable », l'IA redéfinit la chaîne de production culturelle

L'équipe de Doudou Voice a déclaré qu'elle continuera à améliorer l'expression émotionnelle, le soutien des dialectes et les capacités multilingues, tout en développant davantage vers des genres tels que le suspense, la science-fiction et les romans d'amour. Avec la publication quotidienne des romans, les pièces radiophoniques peuvent être mises en ligne simultanément, réalisant ainsi véritablement l'idée de « publication du texte immédiatement disponible en audio ».

Audios narrés par l'IA avec plusieurs personnages Voix Doubao Moteur TTS Pré-entraînement multimodal

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

Révolution des audios narrés par l'IA ! Doubao propose un système de double voice automatique pour plusieurs personnages avec un taux d'identification des personnages de 98 %, à la hauteur des dramatiques radiophoniques professionnels

AIbase基地

Un taux d'identification des personnages de 98 %, l'IA « joue » l'âme des personnages

Tomato Novel applique la technologie en premier, la réaction des utilisateurs dépasse les attentes

De « audible » à « agréable », l'IA redéfinit la chaîne de production culturelle

Cet article provient d'AIbase Daily

GEO Services