سه شنبه۶آبان۱۴۰۴
  • EN
  • تبلیغات
  • تماس با ما
  • درباره ما
فوت و فن
  • دانش و فن
    • موبایل و تبلت
    • هوش مصنوعی
    • اپراتورها و وب
    • برنامه و نرم افزار
    • دنیای بازی
    • گوناگون
      • تلویزیون
      • سخت افزار
  • اقتصاد
    • اقتصاد بین الملل
    • بازارها
    • بانکداری و تجارت الکترونیک
    • خودرو
    • وبگردی
    • رپورتاژ
  • ورزش
    • فوتبال
    • موتوری
  • سبک زندگی
    • سلامت
    • تغذیه
    • طبیعت
    • حیوانات
    • آشپزی
    • خلاقیت
  • گردشگری
    • گردشگری
  • فرهنگ و هنر
    • فیلم و سریال
    • کتاب و مجله
    • آثار باستانی
    • صنایع دستی
  • چند رسانه‌ای
    • عکس
    • ویدیو
    • خودمونی
    • همیاری
هوش مصنوعی

چطور با Google Gemini صدا را رایگان به متن تبدیل کنیم؟ راهنمای سریع و ساده

علی محمدپناه 6 آبان 1404
A+A-
Reset
Google Gemini
1

استفاده از هوش مصنوعی برای رونویسی گفتار چیز جدیدی نیست. اپلیکیشن‌هایی مانند Otter.ai در این زمینه تحول بزرگی ایجاد کرده‌اند و می‌توانند گفتار موجود در فایل‌های صوتی را در مدت زمانی کوتاه به متنی دقیق و خوانا تبدیل کنند.

با این حال، بسیاری از این سرویس‌ها پولی هستند و همین باعث شده پیشنهاد جدید Gemini بسیار جذاب به نظر برسد. کافی است یک فایل صوتی آپلود کنید؛ تا زمانی که مدت آن بیش از ۱۰ دقیقه نباشد، هوش مصنوعی Gemini به‌سرعت آن را تحلیل کرده و برایتان رونویسی می‌کند، آن هم کاملاً رایگان.

شما می‌توانید تا ۱۰ فایل صوتی را به طور هم‌زمان آپلود کنید، به شرطی که مجموع زمان آن‌ها از ۱۰ دقیقه فراتر نرود. Gemini همچنین می‌تواند متن رونویسی شده را ویرایش کند، نکات کلیدی را خلاصه‌سازی کند و اطلاعات خاصی را درون فایل صوتی پیدا کند.

مراحل انجام تبدیل صدا به متن

۱. افزودن فایل صوتی

ابتدا مطمئن شوید که از آخرین نسخه Gemini استفاده می‌کنید. اگر از نسخه اپلیکیشن استفاده می‌کنید، آن را به‌روزرسانی کنید یا در مرورگر به وب‌سایت Google Gemini بروید.

وقتی آماده بودید تا فایل را رونویسی کنید، روی نماد + کلیک کرده و گزینه Upload files را در نسخه مرورگر یا Files را در نسخه اپلیکیشن انتخاب کنید.

۲. انتخاب فایل

اکنون می‌توانید در دستگاه خود به دنبال فایل صوتی مورد نظر بگردید. Gemini از فرمت‌های MP3، AAC و WAV پشتیبانی می‌کند. پس از انتخاب فایل، آن در Gemini بارگذاری می‌شود و آماده پردازش است.

۳. نوشتن پرامپت

در مرحله بعد، عبارتی مانند “transcribe this speech” (این گفتار را رونویسی کن) وارد کنید تا Gemini کار را آغاز کند. اگر با خطا مواجه شدید، کافی است عبارت “try again” (دوباره تلاش کن) را وارد کنید.

در تجربه نویسنده، ابتدا پیام خطایی اشتباه ظاهر شد که می‌گفت فایل صوتی خالی است، در حالی که این‌طور نبود. اما تلاش دوم فوراً موفقیت‌آمیز بود.

۴. ویرایش متن رونویسی شده

هوش مصنوعی Gemini فایل را خیلی سریع رونویسی می‌کند، اما متن حاصل کاملاً کلمه‌به‌کلمه است و شامل کلمات پرکننده گفتاری مانند «اِمم» و «آه» خواهد بود که امری طبیعی است.

برای اصلاح این مورد، می‌توانید پرامپت‌هایی مانند “can you clean it up?” (می‌توانی آن را تمیزتر بنویسی؟) یا “can you remove the ums” (می‌توانی اِمم‌ها را حذف کنی؟) وارد کنید تا Gemini نسخه‌ای ویرایش‌شده و خواناتر از متن را ارائه دهد که در آن کلمات اضافی حذف شده‌اند.

منبع tomsguide
‎‏ جمینایGeminiآموزشآموزش هوش مصنوعیهوش مصنوعی
0 نظر FacebookTwitterPinterestLinkedinTumblrVKRedditEmail
علی محمدپناه

مطلب قبلی
ایمنی‌شناسی فضایی؛ چگونه سفر به فضا سیستم ایمنی بدن را تغییر می‌دهد؟

شما هم نظر دهید Cancel Reply

برای دفعه بعد که نظر می‌دهم نام و ایمیل من را در این مرورگر ذخیره کنید.

* با استفاده از این فرم، با ذخیره و مدیریت داده‌های خود توسط این وب سایت موافقت می‌کنم.

مطالب مرتبط

  • اخراج ۶۰۰ کارمند هوش مصنوعی در متا برای...

    3 آبان 1404
  • هوش مصنوعی سن واقعی بدن را از خون...

    2 آبان 1404
  • مرورگر Atlas؛ آغاز عصر جدید جست‌وجوی هوشمند با...

    2 آبان 1404
  • راهنمای کامل ChatGPT Projects؛ ابزاری برای سازمان‌دهی پروژه‌ها...

    1 آبان 1404
  • رشد کاربران هوش مصنوعی در چین در سال...

    1 آبان 1404
  • مرورگر ChatGPT Atlas معرفی شد؛ مرورگری پر از...

    30 مهر 1404
  • تغییرات جدید ChatGPT از دید روان‌شناسان: مرز باریک...

    27 مهر 1404
  • سرمایه‌گذاری‌های استارتاپی ترکیه در سال ۲۰۲۵؛ میداس در...

    26 مهر 1404
  • ویندوز ۱۱ با Copilot: آغاز عصر هوش مصنوعی...

    26 مهر 1404
  • نسخه Veo 3.1 از راه رسید؛ ابزاری سریع‌تر...

    25 مهر 1404
  • کلاهبرداری‌های هوش مصنوعی؛ تهدید پنهان در دنیای دیجیتال

    24 مهر 1404
  • ظهور اتاق‌های هوشمند در هتل‌ها: تعادلی میان فناوری...

    24 مهر 1404
  • هوش مصنوعی تولید ویدیوی Sora 2 نمونه‌ای از...

    23 مهر 1404

درباره فوت و فن

درباره فوت و فن

با ما تجربه‌ای جذاب از دنیای اطراف را داشته باشید.

در «فوت و فن»، ما به دنبال راه‌های ساده و کاربردی برای بهبود زندگی هستیم. واژهٔ «فن» در فارسی به معنای «شگرد» و «ترفند» است. ما تلاش می‌کنیم این ترفندها را در زندگی روزمره خود به کار ببریم و مطالبی شگفت‌انگیز و مفید را با شما به اشتراک بگذاریم. هدف ما این است که با به اشتراک گذاشتن تجربیات و آموخته‌های خود، به شما کمک کنیم تا روش‌های جدید و ایده‌های تازه‌ای را در زندگی خود بکار ببرید. با ما همراه باشید تا زندگی را با کمک «فوت و فن»، به یک تجربهٔ خلاقانه و لذت‌بخش تبدیل کنیم.

لینک‌های مفید

تماس با ما

 

تبلیغات در فوت و فن

 

درباره ما

Facebook Twitter Instagram Linkedin Tumblr Youtube Email

حامیان

2010-2025@ - All Right Reserved. Designed and Developed by FOOTOFAN

فوت و فن
  • دانش و فن
    • موبایل و تبلت
    • هوش مصنوعی
    • اپراتورها و وب
    • برنامه و نرم افزار
    • دنیای بازی
    • گوناگون
      • سخت افزار
      • تلویزیون
  • اقتصاد
    • اقتصاد بین الملل
    • بازارها
    • بانکداری و تجارت الکترونیک
    • خودرو
    • وبگردی
    • رپورتاژ
  • ورزش
    • فوتبال
    • موتوری
    • تنیس
  • سبک زندگی
    • سلامت
    • تغذیه
    • طبیعت
    • حیوانات
    • خلاقیت
    • آشپزی
  • گردشگری
    • گردشگری
  • فرهنگ و هنر
    • فیلم و سریال
    • کتاب و مجله
    • آثار باستانی
    • صنایع دستی
  • چند رسانه‌ای
    • عکس
    • ویدیو
    • خودمونی
    • همیاری
  • English