तासिंग एवं कुआयिन द्वारा नए SVG डिफ्यूजन मॉडल के साथ साझेदारी, सीखने की दर में 6200% वृद्धि

AIbase基地

द्वारा प्रकाशितAI समाचार · 5 मिनट पढ़ें · Oct 29, 2025

हाल के तकनीकी दुनिया में, VAE (परिवर्तनशील स्व-संकोडक) को धीरे-धीरे अस्पष्टता के लिए छोड़ दिया जा रहा है, चीन के ताइज़ी विश्वविद्यालय और क्विक लिंग टीम के सहयोग से, SVG (VAE बिना संभावना वाला मॉडल) के नाम से एक नया जनरेटिव मॉडल पेश किया गया है। इस नवाचार ने शिक्षण की दक्षता में 6200% की आश्चर्यजनक वृद्धि की है, और जनरेशन गति में 3500% की लंबी छलांग लगाई है।

चित्र उत्पादन के क्षेत्र में VAE के पतन का मुख्य कारण "अर्थ भंग" समस्या है। अर्थात, जब हम केवल चित्र के एक विशेषता (जैसे बिल्ली के रंग) को बदलने की कोशिश करते हैं, तो अन्य विशेषताओं (जैसे आकार, भाव) आमतौर पर प्रभावित हो जाती हैं, जिसके परिणामस्वरूप उत्पादित चित्र असटीक होते हैं। इस समस्या के समाधान के लिए, ताइजी विश्वविद्यालय और क्विक लिंग के SVG मॉडल ने अलग रणनीति का उपयोग किया, जो अर्थ और विवरण के साथ एक विशेषता स्थान बनाता है।

SVG मॉडल के डिजाइन में, टीम ने पहले DINOv3 पूर्व-प्रशिक्षित मॉडल का उपयोग अर्थ निकालने के लिए किया, जो बड़े पैमाने पर स्व-सीख के माध्यम से प्रशिक्षित है, जो विभिन्न श्रेणियों के विशेषताओं की पहचान और अलग करने में सक्षम है, जो पारंपरिक VAE मॉडल में अर्थ अस्पष्टता को हल करता है। इसके अलावा, विवरण के पूरक के लिए, टीम ने एक हल्का अवशिष्ट कोडर विशेष रूप से डिज़ाइन किया, जो विवरण जानकारी को अर्थ विशेषताओं के साथ टकराने से रोकता है। महत्वपूर्ण वितरण तुलना योजना दोनों विशेषताओं के संगम को आगे बढ़ाती है, जो उत्पादित चित्र की उच्च गुणवत्ता की गारंटी देती है।

प्रयोग परिणाम दर्शाते हैं कि SVG मॉडल जनरेशन गुणवत्ता और बहु-कार्य सामान्यता में पारंपरिक VAE समाधान से पूरी तरह से ऊपर है। ImageNet डेटासेट पर, SVG मॉडल केवल 80 चक्रों के साथ प्रशिक्षित होते हैं, FID मान (जो उत्पादित चित्र और वास्तविक चित्र के समानता के मापदंड के रूप में मापा जाता है) 6.57 तक पहुंच गए, जो समान आकार के VAE मॉडल से बहुत आगे है; और अनुमानन दक्षता में, SVG मॉडल भी अद्वितीय प्रदर्शन दिखाता है, जिससे कम नमूना चरणों में स्पष्ट चित्र उत्पन्न हो जाते हैं। इसके अलावा, SVG मॉडल के विशेषता स्थान का उपयोग सीधे चित्र वर्गीकरण, अर्थ विभाजन आदि विज़ुअल कार्यों में किया जा सकता है, बिना अतिसंवेदनशीलता के, जो अनुप्रयोग की लचीलापन को बहुत बढ़ाता है।

ताइजी विश्वविद्यालय और क्विक लिंग की यह नई तकनीक चित्र उत्पादन के क्षेत्र में क्रांतिकारी परिवर्तन लाई है और बहु-माध्यम उत्पादन कार्यों में बहुत बड़ी क्षमता के साथ दिखाई दे सकती है।

पेपर का पता: https://arxiv.org/pdf/2510.15301

VAE SVG तासिंग कुआयिन केलिंग

यह लेख AIbase दैनिक से है

【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।

—— AIbase दैनिक समूह द्वारा बनाया गया

टेक्स्ट से जटिल पात्रों तक: सबसे शक्तिशाली SVG जेनरेटिव मॉडल OmniSVG का आगमन!

9 अप्रैल, 2025 को, OmniSVG नामक एक शक्तिशाली SVG (स्केलेबल वेक्टर ग्राफिक्स) जेनरेटिव मॉडल को आधिकारिक तौर पर लॉन्च किया गया, जिससे वेक्टर ग्राफिक्स जेनरेशन तकनीक एक नए चरण में प्रवेश कर गई है। StepFun और फुदान विश्वविद्यालय द्वारा संयुक्त रूप से विकसित इस मॉडल को वर्तमान में सबसे उन्नत SVG जेनरेटिव मॉडल माना जाता है, जिसकी उत्कृष्ट मल्टी-मॉडल जेनरेशन क्षमता और कुशल प्रदर्शन ने व्यापक ध्यान आकर्षित किया है। OmniSVG का तकनीकी सफलता OmniSVG पूर्व-प्रशिक्षित दृश्य-भाषा मॉडल (Vision-Language Mod...

Apr 10, 2025

230

नया वीडियो जेनरेशन फ़्रेमवर्क SkyReels-A2 जारी: नियंत्रणीय वीडियो जेनरेशन तकनीक में नई ऊँचाई

हाल ही में, Skywork AI की शोध टीम ने SkyReels-A2 नामक एक नया वीडियो जेनरेशन फ़्रेमवर्क लॉन्च किया है, जो नियंत्रणीय वीडियो जेनरेशन तकनीक में एक नई ऊँचाई को दर्शाता है। "तत्व से वीडियो (E2V)" नामक यह फ़्रेमवर्क टेक्स्ट प्रॉम्प्ट के अनुसार विभिन्न दृश्य तत्वों (जैसे कि पात्र, वस्तुएँ, पृष्ठभूमि) को प्राकृतिक वीडियो में संश्लेषित कर सकता है और संदर्भ छवि के साथ उच्च स्तर की संगति बनाए रख सकता है। SkyReels-A2 का मूल इसकी जटिल डेटा प्रोसेसिंग प्रक्रिया में है। शोध टीम ने एक व्यापक डेटा निर्माण पाइपलाइन तैयार की है

Apr 8, 2025

100

IC-light V2 का भव्य विमोचन: 16-चैनल VAE प्रदर्शन में突破, विवरण संरक्षित करने की क्षमता अद्भुत है!

छवि प्रसंस्करण तकनीक की तेजी से प्रगति के इस युग में, Flux आर्किटेक्चर पर आधारित IC-Light V2 ने अपनी 16-चैनल VAE और मूल उच्च-रिज़ॉल्यूशन विशेषताओं के साथ एक क्रांतिकारी सफलता हासिल की है, जो डिजिटल छवि प्रसंस्करण में एक नई दिशा प्रदान करती है। यह नई पीढ़ी का मॉडल न केवल पहले के संस्करण से विवरण संरक्षित करने में काफी अधिक है, बल्कि छवि प्रसंस्करण की सटीकता को एक नई ऊंचाई पर ले जाता है। एक समग्र छवि प्रसंस्करण उपकरण के रूप में, IC-Light V2 की अनुकूलनशीलता आश्चर्यजनक है। चाहे वह तेल चित्रकला हो या एनीमे शैलियों की छवियां, यह सहजता से कार्य कर सकती है।

Oct 28, 2024

4.8k

माइक्रोसॉफ्ट का बेजोड़ अपडेट: एज ब्राउज़र ने SVG प्रारूप में निर्बाध कॉपी-पेस्ट किया

माइक्रोसॉफ्ट ने आज घोषणा की है कि Microsoft Edge और अन्य Chromium-आधारित ब्राउज़र Async Clipboard API के माध्यम से SVG (स्केलेबल वेक्टर ग्राफिक्स) फ़ाइलों की कॉपी और पेस्ट फ़ंक्शन का समर्थन करेंगे। यह महत्वपूर्ण उपलब्धि उपयोगकर्ता अनुभव और वेब विकास दक्षता में उल्लेखनीय सुधार लाएगी।

Jul 12, 2024

3.1k

StarVector मल्टीमॉडल SVG जनरेशन मॉडल ने दृश्य गुणवत्ता में महत्वपूर्ण सुधार किया

StarVector एक मल्टीमॉडल SVG जनरेशन मॉडल है, जो बड़े भाषा मॉडल और दृश्य मॉडल को融合 करता है, जो बिना सीमा के सटीक SVG जनरेट करता है। CLIP इमेज एनकोडर का उपयोग करके दृश्य प्रतिनिधित्व निकाला जाता है, जिसे दृश्य मार्करों में परिवर्तित करने के लिए एडेप्टर का उपयोग किया जाता है, जो दृश्य गुणवत्ता और जटिलता के प्रसंस्करण को महत्वपूर्ण रूप से बढ़ाता है। पेपर SVG-Bench मानक परीक्षण के माध्यम से StarVector के प्रदर्शन को सत्यापित करता है, और नवाचार डेटा सेट SVG-Stack इसके महत्वपूर्ण सुधार प्रभावों की आगे पुष्टि करता है। StarVector SVG जनरेशन तकनीक में एक नई सफलता लाता है।

Dec 21, 2023

980

ओपन-सोर्स आर्ट QR कोड जनरेटर QRBTF विभिन्न शैलियों और SVG डाउनलोड का समर्थन करता है

QRBTF एक ओपन-सोर्स QR कोड साज-सज्जा जनरेटर है, जो विभिन्न आर्ट QR कोड शैलियों की पेशकश करता है। यह पैरामीटर समायोजन और SVG डाउनलोड का समर्थन करता है, बिना बैकएंड के। इसका मुख्य QR कोड जनरेशन पुस्तकालय है davidshimjs/qrcode और cozmo/jsQR।

Aug 22, 2023

1.4k

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

तासिंग एवं कुआयिन द्वारा नए SVG डिफ्यूजन मॉडल के साथ साझेदारी, सीखने की दर में 6200% वृद्धि

AIbase基地

यह लेख AIbase दैनिक से है

संबंधित AI समाचार अनुशंसाएँ

टेक्स्ट से जटिल पात्रों तक: सबसे शक्तिशाली SVG जेनरेटिव मॉडल OmniSVG का आगमन!

नया वीडियो जेनरेशन फ़्रेमवर्क SkyReels-A2 जारी: नियंत्रणीय वीडियो जेनरेशन तकनीक में नई ऊँचाई

IC-light V2 का भव्य विमोचन: 16-चैनल VAE प्रदर्शन में突破, विवरण संरक्षित करने की क्षमता अद्भुत है!

माइक्रोसॉफ्ट का बेजोड़ अपडेट: एज ब्राउज़र ने SVG प्रारूप में निर्बाध कॉपी-पेस्ट किया

StarVector मल्टीमॉडल SVG जनरेशन मॉडल ने दृश्य गुणवत्ता में महत्वपूर्ण सुधार किया

ओपन-सोर्स आर्ट QR कोड जनरेटर QRBTF विभिन्न शैलियों और SVG डाउनलोड का समर्थन करता है

संबंधित AI समाचार अनुशंसाएँ

टेक्स्ट से जटिल पात्रों तक: सबसे शक्तिशाली SVG जेनरेटिव मॉडल OmniSVG का आगमन!

नया वीडियो जेनरेशन फ़्रेमवर्क SkyReels-A2 जारी: नियंत्रणीय वीडियो जेनरेशन तकनीक में नई ऊँचाई

IC-light V2 का भव्य विमोचन: 16-चैनल VAE प्रदर्शन में突破, विवरण संरक्षित करने की क्षमता अद्भुत है!

माइक्रोसॉफ्ट का बेजोड़ अपडेट: एज ब्राउज़र ने SVG प्रारूप में निर्बाध कॉपी-पेस्ट किया

StarVector मल्टीमॉडल SVG जनरेशन मॉडल ने दृश्य गुणवत्ता में महत्वपूर्ण सुधार किया

ओपन-सोर्स आर्ट QR कोड जनरेटर QRBTF विभिन्न शैलियों और SVG डाउनलोड का समर्थन करता है

GEO Services