जब एआई केवल "पढ़ने" के साथ-साथ भावनापूर्ण, चरित्र वाले बहु-भाषीय ध्वनि नाटक का निर्देशन भी कर सकता है, तो ध्वनि सामग्री उद्योग में एक अविश्वसनीय परिवर्तन आ रहा है। हाल ही में, डूबाओ ध्वनि टीम ने आधुनिक "AI बहु-भाषीय ध्वनि नाटक" स्वचालित उत्पादन समाधान के रूप में आधिकारिक रूप से घोषणा की, जो बुनियादी उपन्यास पाठ से तैयार रेडियो नाटक तक के एंड-टू-एंड बिना मनुष्य के हस्तक्षेप के उत्पादन की पहली बार तकनीक है - कोई ध्वनि अभिनेता या बाद की काट आवश्यकता नहीं होती है, लागत में तेजी से कमी आ गई है और दक्षता बढ़ गई है, लेकिन परिणाम व्यावसायिक स्तर के रेडियो नाटक के समान हैं।

image.png

98% चरित्र पहचान सटीकता, AI नाटक के आत्मा को "अभिनय" करता है

इस समाधान का मुख्य अभियान एक उच्च प्राकृतिकता बहु-भाषीय ध्वनि संश्लेषण (TTS) इंजन है। बहुत सारे उपन्यास पाठ और ध्वनि डेटा के बहु-मोडल पूर्व-प्रशिक्षण के माध्यम से, AI बातचीत में अलग-अलग चरित्रों को सटीक रूप से अलग कर सकता है, 98% से अधिक चरित्र विभाजन की सटीकता है, और प्रत्येक चरित्र के लिए उसके व्यक्तित्व, भावना और परिस्थिति के अनुरूप टोन, गति और भाषा को देता है। ठंडा दुष्ट के गहरे हंसी, या लड़की प्रमुख के हल्के उछले ढंग के लिए, AI विस्तार से अभिनय कर सकता है, जिससे पारंपरिक TTS "एक व्यक्ति द्वारा सभी चेहरे" की यांत्रिकता का अंत हो जाता है।

अधिक आगे, प्रणाली स्वचालित रूप से पृष्ठभूमि संगीत, वातावरण ध्वनि और संक्रमण प्रभाव जोड़ सकती है - बारिश के रात के झगड़े में बर्फ के बरसात और पैर के अवशेष के साथ, राजकुमारी बातचीत के साथ पुराने पियानो और मोमबत्ती के चमक के साथ, फिल्म स्तर के अंतर्निहित श्रवण अनुभव बनाया जाता है।

तमाम उपन्यास पहले लागू हुए, उपयोगकर्ता प्रतिक्रिया अपेक्षा से अधिक रही

इस तकनीक को जियूबिते के अंतर्गत टोमाटो उपन्यास एपी के साथ पहली बार व्यावसायिक लागू किया गया। पहले AI द्वारा बनाए गए बहु-भाषीय ध्वनि नाटक लॉन्च होने के बाद, तुरंत पुस्तक प्रेमियों द्वारा गर्म प्रतिक्रिया प्राप्त हुई: "वह विशेषज्ञ ध्वनि अभिनेता टीम द्वारा बनाए गए रेडियो नाटक की तरह लग रहा है" "चरित्र परिवर्तन कोई अस्वाभाविकता नहीं है" "मानव तुलना में दस गुना तेजी से अपडेट करता है।" यह न केवल प्लेटफॉर्म में सामग्री की पूर्ति को बहुत बढ़ा दिया है, बल्कि बड़ी संख्या में मध्य-लंबे समय तक के उपन्यासों के लिए पहली बार उच्च गुणवत्ता ध्वनि के अवसर के लिए अवसर प्रदान करता है।

"सुनने योग्य" से "अच्छी तरह से सुनने योग्य" तक, AI सांस्कृतिक उत्पादन श्रृंखला को पुनर्निर्मित करता है

डूबाओ ध्वनि टीम ने कहा कि वे भावना अभिव्यक्ति, बोली समर्थन और बहुभाषीय क्षमता के सुधार में आगे बढ़ेंगे और अधिक विषय जैसे धांसू, विज्ञान साहित्य, रोमांस आदि तक विस्तार करेंगे। जैसे-जैसे उपन्यास दैनिक रूप से अपडेट होते हैं, ध्वनि नाटक भी समान रूप से लॉन्च हो सकते हैं, जिससे "लेखन प्रकाशन ध्वनि उपलब्ध हो" के वास्तविक रूप में हो सकता है।

आवृत्ति सामग्री की मांग में वृद्धि के आज, पारंपरिक ध्वनि पुस्तक निर्माण ऊंचे लागत और लंबे समय के कारण बड़ी संख्या में ऑनलाइन उपन्यासों को कवर करने में असमर्थ है। लेकिन डूबाओ का स्वचालित समाधान, इस उद्योग के बाधा को हल करने के साथ-साथ एक AI-मूल ध्वनि सामग्री के युग के प्रसंग के संकेत देता है - भविष्य में, प्रत्येक उपन्यास के लिए अपने "AI नाटक टीम" हो सकते हैं, और सुनने वाले व्यक्ति, अपने जीवन में कभी नहीं देखे गए बहुत बड़े, तत्काल, उच्च गुणवत्ता ध्वनि अनुभव का आनंद ले सकते हैं।