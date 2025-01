🙋‍♂️️সম্পর্কে



কোকোরো v0.19 মাত্র 82M প্যারাম এবং খুব উচ্চ-মানের আউটপুট সহ একটি সম্প্রতি প্রকাশিত টেক্সট-টু-স্পিচ মডেল। এটি Apache লাইসেন্সের অধীনে প্রকাশিত হয়েছে এবং <100 ঘন্টার অডিওতে প্রশিক্ষণ দেওয়া হয়েছে। এটি বর্তমানে আমেরিকান, ব্রিটিশ ইংরেজি, ফরাসি, কোরিয়ান, জাপানি এবং ম্যান্ডারিনকে সমর্থন করে, খুব ভাল কণ্ঠে।

মানের একটি উদাহরণ:

আমি সবসময় আমার ইবুক লাইব্রেরীকে অডিওবুকে রূপান্তর করার স্বপ্ন দেখেছি। বিশেষ করে সেই বিশেষ বইগুলির জন্য যা আপনি audiobook বিন্যাসে খুঁজে পাবেন না। যেহেতু কোকোরো বেশ দ্রুত, আমি ভেবেছিলাম এটি শেষ পর্যন্ত সম্ভব হতে পারে। আমি Audiblez নামে একটি ছোট টুল তৈরি করেছি (জনপ্রিয় অডিওবুক প্ল্যাটফর্মের সম্মানে) যেটি .epub ফাইলগুলিকে পার্স করে এবং বইয়ের বডিকে সুন্দরভাবে বর্ণনা করা অডিও ফাইলে রূপান্তর করে৷

আমার M2 ম্যাকবুক প্রোতে, রিচার্ড ডকিন্সের সেলফিশ জিনকে mp3 তে রূপান্তর করতে প্রায় 2 ঘন্টা সময় লাগেযা প্রায় 100,000 শব্দ (বা 600,000 অক্ষর), প্রতি সেকেন্ডে প্রায় 80 অক্ষর হারে।

কিভাবে ইন্সটল এবং রান করবেন

আপনার কম্পিউটারে পাইথন 3 থাকলে, আপনি এটি পিপ দিয়ে ইনস্টল করতে পারেন। সচেতন থাকুন যে এটি পাইথন 3.13 এর সাথে কাজ করবে না।

তারপরে আপনাকে একই ফোল্ডারে কয়েকটি অতিরিক্ত ফাইল ডাউনলোড করতে হবে, যা প্রায় ~ 360MB:

pip install audiblez wget wget

তারপরে, একটি ইপাব ফাইলকে একটি অডিওবুকে রূপান্তর করতে, শুধু চালান:

audiblez book.epub -l en-gb -v af_sky

এটি প্রথমে একটি গুচ্ছ তৈরি করবে book_chapter_1.wav , book_chapter_2.wav ইত্যাদি ফাইল একই ডিরেক্টরিতে, এবং শেষে এটি একটি উত্পাদন করবে book.m4b পুরো বই সহ ফাইলটি আপনি ভিএলসি বা যেকোনো অডিওবুক প্লেয়ার দিয়ে শুনতে পারেন। এটি শুধুমাত্র উত্পাদন করবে .m4b আপনার কাছে থাকলে ফাইল করুন ffmpeg আপনার মেশিনে ইনস্টল করুন।

সমর্থিত ভাষা

ব্যবহার করুন -l ভাষা নির্দিষ্ট করার বিকল্প, উপলব্ধ ভাষা কোড হল: 🇺🇸 en-us 🇬🇧 en-gb 🇫🇷 fr-fr 🇯🇵 ja 🇰🇷 kr এবং 🇨🇳 cmn .

সমর্থিত ভয়েস

ব্যবহার করুন -v ভয়েস নির্দিষ্ট করার বিকল্প: উপলব্ধ ভয়েস হয় af , af_bella , af_nicole , af_sarah , af_sky , am_adam , am_michael , bf_emma , bf_isabella , bm_george , bm_lewis . আপনি এখানে তাদের চেষ্টা করতে পারেন:

অধ্যায় সনাক্তকরণ

অধ্যায় শনাক্তকরণ কিছুটা জটিল, তবে এটি বেশিরভাগ .epub-এ আমি চেষ্টা করেছি, কভার, সূচক, পরিশিষ্ট ইত্যাদি বাদ দিয়ে মূল অধ্যায়গুলি খুঁজে পেতে পরিচালনা করে।

আপনি যদি এটিতে আপনার আগ্রহের অধ্যায়টি অন্তর্ভুক্ত না করে দেখেন তবে এর সাথে খেলার চেষ্টা করুন৷ is_chapter কোডে ফাংশন। প্রায়শই এটি মুখবন্ধ বা ভূমিকা এড়িয়ে যায় এবং আমি নিশ্চিত নই যে এটি একটি বাগ বা বৈশিষ্ট্য কিনা।

উৎস

দেখুন GitHub-এ Audiblez প্রকল্প.

এখনও কিছু রুক্ষ প্রান্ত আছে, কিন্তু এটা আমার জন্য যথেষ্ট ভাল কাজ করে. ভবিষ্যতের উন্নতিগুলি অন্তর্ভুক্ত করতে পারে:

আরও ভাল অধ্যায় সনাক্তকরণ, অথবা ব্যবহারকারীদের অধ্যায় অন্তর্ভুক্ত/বাদ দেওয়ার অনুমতি দিন।

m4b ফাইলে অধ্যায় নেভিগেশন যোগ করুন (এটি দেখতে কঠিন, কারণ ffmpeg এটি করে না)

কিছু ইমেজ-টু-টেক্সট মডেল ব্যবহার করে ছবির জন্য বর্ণনা যোগ করুন

