शॉटकट २५.१० स्थानिक एआय, एचटीएमएल आणि नेटिव्ह कॅप्चरसह येते

  • कोकोरोडोकीसह स्थानिक टेक्स्ट-टू-स्पीच आणि डॉकरद्वारे CPU/GPU सपोर्ट.
  • प्रीसेट, पारदर्शकता आणि १५ FPS मर्यादेसह HTML जनरेटर आणि "टाइपराइटर" फिल्टर.
  • वातावरणानुसार मूळ स्क्रीन रेकॉर्डिंग (FFmpeg, GNOME, Spectacle किंवा OBS).
  • FFmpeg 8 मध्ये अपडेट, सुधारित लायब्ररी आणि अनेक प्रमुख दुरुस्त्या.

शॉर्टकट 25.10

लिनक्स डेस्कटॉपवरील सर्वात प्रसिद्ध ओपन-सोर्स व्हिडिओ एडिटर तो आणखी एक हालचाल करतो.. शॉर्टकट 25.10 ते आधीच येथे आहे आणि उत्पादकतेला थेट लक्ष्य करणाऱ्या वैशिष्ट्यांनी भरलेले आहे: स्थानिक कृत्रिम बुद्धिमत्ता, स्टायलिश शीर्षकांसाठी HTML जनरेटर आणि बाह्य उपयुक्ततांवर अवलंबून राहण्याचे टाळणारे मूळ स्क्रीन रेकॉर्डिंग.

बीटा चाचणी कालावधीनंतर, स्थिर आवृत्ती म्हणून प्रकाशन केल्याने पुष्टी होते की प्रकल्प त्याच्या रोडमॅपनुसार स्थिरपणे प्रगती करत आहे. टेक्स्ट-टू-स्पीच (TTS) ही सर्वात मोठी नवीनता आहे. नोट्स आणि सबटायटल्ससाठी, टाइपरायटर फिल्टरसह, HTML वरून इमेज/व्हिडिओ जनरेटर आणि FFmpeg 8 वर अपडेट, सुधारणा आणि सुसंगतता सुधारणांचे एक चांगले पॅकेज विसरू नका.

आढावा: शॉटकट २५.१० मध्ये काय बदल होत आहेत

अलिकडच्या काळात टीम एआय वैशिष्ट्ये समाविष्ट करत आहे: प्रथम व्हिस्पर (व्हॉइस-टू-टेक्स्ट) सह ट्रान्सक्रिप्शन आले आणि आता वर्तुळ पूर्ण झाले आहे एकात्मिक आणि स्थानिक मजकूर-ते-भाषणहे संयोजन संपादक न सोडता कथन, उपशीर्षक आणि सामग्री सुलभ करण्यासाठी खूप शक्तिशाली कार्यप्रवाह उघडते.

एआय सोबत, हा हप्ता सादर करतो HTML द्वारे समर्थित सर्जनशील साधने आणि समुदायाने विनंती केलेली वैशिष्ट्ये, जसे की क्रॉस-प्लॅटफॉर्म स्क्रीन रेकॉर्डिंग. हे रिलीझ अपडेटेड FFmpeg 8 आणि की लायब्ररीसह तांत्रिक पाया देखील वाढवते.

शॉटकट २५.१० मध्ये नोट्स आणि सबटायटल्ससाठी स्थानिक टेक्स्ट-टू-स्पीच सादर केले आहे.

शॉटकटमध्ये TTS ची अंमलबजावणी यावर अवलंबून आहे KokoroDoki आणि Kokoro 82M मॉडेलहे एक ओपन-सोर्स स्पीच सिंथेसिस इंजिन आहे जे रिअल टाइममध्ये काम करू शकते. हे लक्षात घेण्यासारखे आहे की आवृत्ती २५.०७ मध्ये एक मॉडेल समाविष्ट केले आहे भाषण ते मजकूरसर्वात उल्लेखनीय वैशिष्ट्य म्हणजे सर्वकाही तुमच्या संगणकावर घडते: क्लाउडवर कोणतेही प्रसारण होत नाही, त्यामुळे प्रकल्पाची गोपनीयता आणि नियंत्रण हमी दिले जाते.

प्रक्रिया जलद करण्यासाठी, कोकोरोडोकी CUDA सह NVIDIA CPU किंवा GPU वापरू शकते.सुसंगत ग्राफिक्स कार्ड असलेल्या मशीनवर, तुम्हाला जनरेशन वेळ खूपच कमी आढळेल, जो सबटायटल्सच्या अनेक ओळींवर पुनरावृत्ती करताना किंवा लांब व्हॉइसओव्हर तयार करताना कौतुकास्पद आहे.

आवाजांबद्दल, सध्याचे पॅकेज इंग्रजीमध्ये अधिक पूर्ण आहे. अमेरिकन इंग्रजीमध्ये वीसपेक्षा जास्त आवाज आहेत.ब्रिटिश आवृत्ती सुमारे आठ भाषा देते आणि सध्या इतर भाषांसाठी कव्हरेज अधिक मर्यादित आहे. भविष्यातील आवृत्त्यांमध्ये ही श्रेणी वाढेल अशी अपेक्षा आहे, परंतु सुरुवातीला मॉडेल्स, प्रोटोटाइप आणि अंतिम प्रकल्पांसाठी इंग्रजीमध्ये आधीच पुरेशी सामग्री आहे.

लक्षात ठेवण्यासाठी एक तांत्रिक तपशील आहे: डॉकर वापरून एकत्रीकरण केले जाते.हे इतर वैशिष्ट्यांच्या तुलनेत सेटअपमध्ये एक अतिरिक्त पायरी जोडते, विशेषतः जर तुम्ही यापूर्वी कधीही कंटेनरसह काम केले नसेल. हा एक दुर्गम अडथळा नाही, परंतु सर्वकाही व्यवस्थित करण्यासाठी काही मिनिटे बाजूला ठेवणे योग्य आहे.

शॉटकट २५.१०, HTML आणि टाइपरायटर इफेक्टमधून जनरेट करत आहे

सर्जनशीलता दोन योगदानांसह विस्तारते जे एकमेकांशी जोडलेले असतात: एक नवीन "HTML वरून प्रतिमा/व्हिडिओ" जनरेटर आणि टाइपरायटरचे अनुकरण करणारा मजकूर प्रभाव. दृष्टिकोन स्पष्ट आहे: पारदर्शक पार्श्वभूमीसह आणि कोणत्याही असामान्य प्लगइनशिवाय शीर्षके, मथळे आणि अ‍ॅनिमेशन तयार करण्यासाठी ब्राउझर क्षमता टाइमलाइनमध्ये आणणे.

HTML जनरेटर तयार करतो डीफॉल्टनुसार पारदर्शकता असलेल्या प्रतिमा किंवा क्लिपस्थिरता राखण्यासाठी, जनरेट केलेले व्हिडिओ प्रति सेकंद १५ फ्रेम्स पर्यंत मर्यादित आहेत, जे ग्राफिक्स आणि ओव्हरलेसाठी पुरेसे मूल्य आहे जे अडथळे टाळते. परिणाम लगेच दिसून येतो. ते ओरिजिन व्ह्यूअरमध्ये आपोआप उघडते. त्याच्या HTML सोबत, जेणेकरून तुम्ही लगेच कोडचे पुनरावलोकन किंवा बदल करू शकता.

"मजकूर: टाइपरायटर" इफेक्टमध्ये वापरण्यास तयार प्रीसेट आणि कस्टमायझेशनसाठी डिझाइन केलेले इतर समाविष्ट आहेत. समाविष्ट केलेल्या प्रोफाइलमध्ये हे समाविष्ट आहे: ३डी प्रतिमा, लवचिक स्ट्रोक, दुमडलेला, सोन्याचा धातू o उत्सवाची वेळया साधनांमध्ये सॉलिड इमेज फिनिशपासून ते अधिक खेळकर व्हिडिओ अॅनिमेशनपर्यंत सर्वकाही समाविष्ट आहे. जर तुम्हाला CSS आणि JS मध्ये आरामदायी वाटत असेल, तर तुमच्याकडे खूप गंभीर काम तयार करण्याची संधी आहे.

  • सह सुसंगतता कोडपेन वरून संकलित केलेला कोड, तुमच्याकडे आधीच असलेल्या स्निपेट आणि डिझाइन्सचा पुनर्वापर करण्यासाठी आदर्श.
  • च्या मर्यादेसह रेंडर करा स्थिरतेसाठी १५ FPS ब्राउझर-आधारित पिढीमध्ये.
  • सर्जनशील शक्यतांसह पारदर्शक पार्श्वभूमी गुंतागुंतीच्या रचनांशिवाय.

मूळ आणि क्रॉस-प्लॅटफॉर्म स्क्रीन रेकॉर्डिंग

आणखी एक क्लासिक समुदाय विनंती अखेर आली आहे: एकात्मिक स्क्रीन रेकॉर्डिंगपर्यावरणानुसार अंमलबजावणी बदलते, परंतु सर्व प्रकरणांमध्ये घर्षण कमी करण्यासाठी सर्वात विश्वासार्ह नेटिव्ह बॅकएंडचा शोध घेण्यात आला आहे.

  • X11- मुख्य बॅकएंड म्हणून FFmpeg वापरणे.
  • वेयलँड (जीनोम): मूळ कॅप्चर/स्क्रीनकास्ट टूलसह एकत्रीकरण.
  • केडीई प्लाझ्मा: कॅप्चरसाठी स्पेक्टॅकलमध्ये सपोर्ट.
  • पर्यायीजर वरीलपैकी काहीही नसेल, तर खालील गोष्टींचा अवलंब करा: ओबीएस स्टुडिओ वाइल्ड कार्ड म्हणून.

यामुळे बहुतेक प्रकरणांमध्ये अतिरिक्त उपयुक्तता स्थापित करणे टाळले जाते आणि कार्यप्रवाह एकत्रित करतेतुम्ही एकाच अॅप्लिकेशनमधून रेकॉर्ड, एडिट आणि एक्सपोर्ट करता. ट्युटोरियल, सॉफ्टवेअर रिव्ह्यू किंवा ट्रेनिंग सेशनच्या निर्मात्यांसाठी, ही एक सुधारणा आहे जी पहिल्या दिवसापासूनच लक्षात येते.

शॉटकट २५.१० मल्टीमीडिया इंजिन अपडेट करते: FFmpeg ८ आणि लायब्ररी

हुडखालीही हालचाल आहे. अॅप वर स्विच करते एफएफएमपीजी 8याचा अर्थ एन्कोडिंग/डिकोडिंगमध्ये सुधारणा, नवीन फिल्टर्स आणि आधुनिक फॉरमॅटसह व्यापक सुसंगतता. व्यावहारिक पातळीवर, हे अधिक सुसंगत निर्यात आणि जटिल प्रकल्पांचे सहज प्लेबॅकमध्ये भाषांतरित करते.

आवश्यक घटक देखील अद्यतनित केले जात आहेत, जसे की SVT-AV1, libaom, dav1d, libvpx, libwebp y whisper.cppहे तुकडे AV1, VP9, ​​WebP कोडेक्स किंवा AI ट्रान्सक्रिप्शनवर परिणाम करतात, अधिक मजबूत वर्कफ्लोसाठी वर्तुळ बंद करतात.

शॉटकट २५.१० इंटरफेस आणि वर्कफ्लो सुधारणा

लहान तपशील जे जोडतात: पर्याय आता प्रॉपर्टीज पॅनेलमध्ये उपलब्ध आहेत. "ओपन विथ" आणि "रिचार्ज"जेव्हा तुम्हाला बाह्यरित्या संपादित केलेले मीडिया रिफ्रेश करायचे असते किंवा सिस्टम अॅपसह ते जलद लाँच करायचे असते तेव्हा हे माफक पण व्यावहारिक बदल आहेत.

नवीन "HTML वरून प्रतिमा/व्हिडिओ" जनरेटर हे "मजकूर: टाइपरायटर" फिल्टरसह एकत्र राहते, म्हणून तुम्ही हे करू शकता टाइमलाइनच्या बाहेर HTML जनरेशन एकत्र करा (मीडिया अॅसेट म्हणून) आधीच घातलेल्या क्लिपवर टाइपरायटर अॅनिमेशन लागू केले आहे. वापराच्या प्रकारानुसार एकूण लवचिकता.

शॉटकट २५.१० बग फिक्सेस आणि स्थिरता सुधारणा

या प्रकाशनात अनेक त्रासदायक समस्यांचे निराकरण केले आहे ज्या नोंदवल्या गेल्या होत्या, जसे की अद्यतन 25.08. उदाहरणार्थ, जेव्हा नाव किंवा पथमध्ये अँपरसँड (&) वर्ण असतो तेव्हा निर्यात अयशस्वी होते., सामायिक प्रकल्पांपेक्षा ही एक सामान्य समस्या आहे.

ते देखील सोडवते a लिनक्सवर अ‍ॅपइमेज सुरू करण्यात समस्या जेव्हा AppImageLauncher स्थापित केले गेले आणि ते दुरुस्त केले गेले «मजकूर: समृद्ध» मधील प्रगत कीफ्रेम्स जे जसे वागायला हवे होते तसे वागत नव्हते. शेवटी, एक Ut व्हिडिओ डीकोड करताना अल्फा चॅनेलमध्ये त्रुटी आली., व्यावसायिक पाइपलाइनमध्ये पारदर्शकपणे काम करणाऱ्यांसाठी महत्त्वाचे.

स्थापना आणि सुसंगतता

लिनक्समध्ये जीवन सोपे करण्यासाठी, प्रकल्प वितरित करतो युनिव्हर्सल अ‍ॅपइमेज जे तुम्ही अवलंबित्वे स्थापित न करता डाउनलोड आणि चालवू शकता. प्रत्यक्षात, ते फक्त एक्झिक्युट परवानग्या देण्याचे काम आहे आणि तुम्ही पूर्ण केले.

सुसंगततेच्या बाबतीत, यासाठी समर्थनाची पुष्टी झाली आहे उबंटू २२.०४ LTS वर glibc २.३५म्हणून, ती LTS आवृत्ती समाविष्ट आहे. कोणतेही आधुनिक वितरण ज्यामध्ये कर्नल ५.१० पेक्षा जास्त ते सुरळीत चालले पाहिजे, तर जुन्या सिस्टीमवर तुम्हाला लायब्ररी समायोजित करण्याची आवश्यकता असू शकते.

वापराची प्रकरणे: निर्मात्यांपासून शिक्षक आणि विकासकांपर्यंत

सोशल मीडिया किंवा YouTube वर कंटेंट तयार करणाऱ्यांसाठी हे पॅकेज परिपूर्ण आहे. तुम्ही एडिटर न सोडता स्क्रीन रेकॉर्ड करता.तुम्ही स्टायलिश टेक्स्ट इफेक्ट्स लागू करता आणि प्रत्येक बदलाचे वर्णन न करता प्रस्तावना, स्पष्टीकरण किंवा कृतीसाठी कृत्रिम आवाज निर्माण करता.

  • व्हिडिओ शिकवण्या: गतिमान लयीसाठी एकात्मिक रेकॉर्डिंग + TTS भाष्ये.
  • सादरीकरणेसशुल्क प्लगइनशिवाय व्यावसायिक अ‍ॅनिमेटेड शीर्षके.
  • प्रवेशयोग्यताव्हिस्पर (व्हॉइस टू टेक्स्ट) आणि टीटीएस एकत्र करून तुम्ही सबटायटलिंग आणि कथन सुधारू शकता.

शिक्षण आणि प्रशिक्षणात, मूल्य स्पष्ट आहे: रेकॉर्ड केलेले वर्ग, व्हिडिओ ट्युटोरियल आणि स्थानिकरित्या तयार केलेल्या लेबल्स आणि व्हॉइसओव्हरसह सहाय्यक साहित्य. अनेक इंग्रजी व्हॉइस प्रोफाइल प्रेक्षकांनुसार स्वर बदलण्याची परवानगी देतात.

  • सॉफ्टवेअर डेमोबाह्य साधनांवर अवलंबून न राहता मूळ अनुप्रयोग कॅप्चर.
  • दृश्य दस्तऐवजीकरणतांत्रिक भाष्ये आणि वाचनीय मजकूर असलेले व्हिडिओ.
  • इंटरफेस चाचणी: जलद अभिप्रायासाठी वर्कफ्लो रेकॉर्ड करा आणि पुनरावलोकन करा.

मागील आवृत्तीशी जलद तुलना

मागील आवृत्तीच्या तुलनेत, सुधारणा लक्षणीय आहेत. मूळ रेकॉर्डिंग हे बहुतेक डेस्कटॉपवर अतिरिक्त उपायांची आवश्यकता दूर करते आणि HTML+टाइपराइटर संयोजन शीर्षके आणि खालच्या तृतीयांश पर्यायांना गुणाकार करते.

  • एकात्मिक रेकॉर्डिंग OBS न करता (पर्यायी परिस्थिती वगळता).
  • प्रगत मजकूर प्रभाव HTML/CSS सपोर्ट आणि दर्जेदार प्रीसेटसह.
  • मजकूर ते भाषण शॉटकटमध्येच नोट्स आणि सबटायटल्ससाठी.
  • एफएफएमपीजी 8 चांगल्या कामगिरीसाठी आणि सध्याच्या स्वरूपांसाठी.
  • प्रबलित स्थिरता सामान्य एज केसेसमध्ये सुधारणांसह.

आवश्यकता आणि शिफारस केलेले कॉन्फिगरेशन

सर्वकाही सुरळीत चालण्यासाठी, संतुलित संघाचे लक्ष्य ठेवणे चांगले. ८ जीबी रॅमसह तुम्ही काम करू शकतापण जर तुम्ही मध्यम/मोठ्या प्रकल्पांवर काम करत असाल तर तुम्हाला १६ जीबी असणे आवडेल.

  • सीपीयू: इफेक्ट्स आणि लूज एन्कोडिंगसाठी कमीत कमी ४ कोर.
  • रॅमकिमान ८ जीबी, १६ जीबीची शिफारस केली जाते.
  • GPU द्रुतगती: OpenGL 3.3+ शी सुसंगत; जर तुम्ही CUDA वापरत असाल तर ते कोकोरोडोकीसह TTS ला गती देईल.
  • संचयनमीडिया आणि कॅशेसाठी एसएसडी, विशेषतः हेवी कोडेक्स असलेल्या प्रकल्पांमध्ये.

प्रकल्प सेटिंग्जमध्ये, ही एक चांगली कल्पना आहे FPS आणि रिझोल्यूशन जुळवा अनावश्यक रीस्केलिंग टाळण्यासाठी तुमच्या अंतिम गंतव्यस्थानावर पोहोचा. प्रॉक्सी आणि ऑप्टिमाइझ केलेले प्रिव्ह्यू राखल्याने फिल्टर आणि एकाधिक ट्रॅक जोडताना तुम्हाला लॅग होण्यापासून वाचवता येईल.

HTML, कोडपेन आणि टाइपरायटरसह कार्यप्रवाह

जर तुम्ही खरोखरच HTML जनरेटरला पुढे ढकलणार असाल, तुमच्या एडिटरमध्ये किंवा कोडपेनवर डिझाइनवर काम करा.संसाधने संकलित/पॅकेज करा आणि त्यांना शॉटकट टेम्पलेटमध्ये पेस्ट करा. हे सुनिश्चित करते की फॉन्ट, शैली आणि स्क्रिप्ट बाह्य कॉलशिवाय सोडवले जातात.

मजकूर अ‍ॅनिमेशनसाठी, पर्यायी करा "मजकूर: टाइपरायटर" फिल्टर करा. आणि बाह्य निर्मिती: जेव्हा तुम्हाला वेग आणि हलके काहीतरी हवे असते, तेव्हा फिल्टर तुम्हाला अडचणीतून बाहेर काढतो; जर तुम्हाला जटिल फिनिशची आवश्यकता असेल, तर HTML प्रवाह तुम्हाला अधिक नियंत्रण (आणि मूळ पारदर्शकता) देईल.

कामगिरी, गोपनीयता आणि मर्यादांवरील नोट्स

स्थानिक पातळीवर TTS पद्धतीचे दोन मोठे फायदे आहेत: तुमच्या कंटेंटचे संरक्षण करा हे विलंब किंवा ऑनलाइन सेवा शुल्क टाळते. त्या बदल्यात, त्याला डॉकर कॉन्फिगरेशन आणि जास्तीत जास्त गतीसाठी, CUDA क्षमतांसह NVIDIA GPU आवश्यक आहे.

ची मर्यादा HTML जनरेशनमध्ये १५ FPS हे फक्त एक लहरीपणा नाही: जेव्हा ब्राउझर इंजिन पारदर्शकता आणि स्तरांसह व्हिडिओ किंवा प्रतिमा जनरेट करते तेव्हा ते रेंडरिंग स्थिर करते. प्रत्यक्षात, शीर्षके, संक्रमणे आणि ओव्हरलेसाठी ते पुरेसे आहे.

फरक पाडणारे छोटे तपशील

पर्याय गुणधर्मांमध्ये "यासह उघडा" हे बाह्य टूलमध्ये क्लिप संपादित करणे आणि थ्रेड न गमावता परत जाणे वेगवान करते, तर "रिचार्ज" जर डिस्कवर फाइल बदलली असेल तर मीडिया फाइल सक्तीने अपडेट करण्याची परवानगी देते. त्या दोन कीज, तसेच HTML-व्युत्पन्न सामग्री स्वयंचलितपणे उघडणारा सोर्स व्ह्यूअर, दैनंदिन कामे खूप सोपी करतात.

बेरीज FFmpeg 8 आणि सुधारित ग्रंथालये यामुळे मनाची शांती देखील मिळते: आयात/निर्यात करताना कमी आश्चर्य आणि AV1 सारख्या अलीकडील फॉरमॅटची चांगली हाताळणी, तसेच बारीक डीकोडिंग.

मागील आवृत्त्यांमधून येणाऱ्यांना एक संपादक मिळेल जो ते त्याचे सार न गमावता परिपक्व झाले आहे.हे मोफत, क्रॉस-प्लॅटफॉर्म आहे आणि स्थानिक विकासाला अनुकूल असे तांत्रिक डिझाइन पर्याय आहेत. प्रकल्पाला जिथे गरज आहे तिथे तो काम करत आहे अशी भावना आहे: कामगिरी, व्यावहारिक एआय आणि सौम्य शिक्षण वक्रांसह सर्जनशील साधने.

शॉर्टकट 25.05
संबंधित लेख:
शॉटकट २५.०५ मध्ये Qt आवृत्ती ६.८.३ वर अपग्रेड करताना HDR सुधारणा जोडल्या आहेत.