یکشنبه, ۲۱ اردیبهشت ۱۴۰۴
  • EN
  • تبلیغات
  • تماس با ما
  • درباره ما
فوت و فن
  • دانش و فن
    • موبایل و تبلت
    • هوش مصنوعی
    • اپراتورها و وب
    • برنامه و نرم افزار
    • دنیای بازی
    • گوناگون
      • تلویزیون
      • سخت افزار
  • اقتصاد
    • اقتصاد بین الملل
    • بازارها
    • بانکداری و تجارت الکترونیک
    • خودرو
    • وبگردی
    • رپورتاژ
  • ورزش
    • فوتبال
    • موتوری
  • سبک زندگی
    • سلامت
    • تغذیه
    • طبیعت
    • حیوانات
    • آشپزی
    • خلاقیت
  • گردشگری
    • گردشگری
  • فرهنگ و هنر
    • فیلم و سریال
    • کتاب و مجله
    • آثار باستانی
    • صنایع دستی
  • چند رسانه‌ای
    • عکس
    • ویدیو
    • خودمونی
    • همیاری
هوش مصنوعیسبک زندگی

کشف زبان پنهان لحن گفتار: هوش مصنوعی و آینده تعاملات انسانی

شهاب الدین حدیدی 17 اردیبهشت 1404
A+A-
Reset
لحن گفتار
1

هر چند دهه یکبار، فناوری نحوه درک بشر از خود را تغییر می‌دهد. انقلاب هوش مصنوعی، که به سرعت در سه سال گذشته در حال پیشرفت است، یکی از آن لحظات حیاتی است. حالا دیگر تنها کلمات نیستند که فناوری در حال کشف و درک آن‌هاست، بلکه گفتار و لحن پشت آن‌ها نیز مورد توجه قرار گرفته‌اند.

ظهور مدل‌های زبان بزرگ و توانمندی در تقلید ارتباطات انسانی

با افزایش اهمیت مدل‌های زبانی مانند ChatGPT، این موضوع آشکار شده است که ماشین‌ها قادرند به‌طور قابل‌توجهی ارتباطات انسانی را تقلید کنند. با این حال، یک لایه عمیق‌تر از تعامل باقی مانده است که تنها در کلمات یافت نمی‌شود.

تحقیق جدید در موسسه وایزمن و کشف لحن گفتار به عنوان یک زبان مستقل

تحقیقی که اخیراً توسط آزمایشگاه پروفسور الیشا موسی در موسسه وایزمن انجام شده، این بعد گمشده را آشکار کرده است.
این تحقیق نشان می‌دهد که لحن گفتار – که به آن «پروزودی» گفته می‌شود – یک زبان ساختاری و مستقل است که واژگان، معنای‌شناسی و دستور زبان خود را دارد و منتظر رمزگشایی است.

گفتار بیش از کلمات است

در زندگی روزمره، کلمات تنها بخشی از تعاملات انسانی را تشکیل می‌دهند. پروزودی یا موسیقی گفتار شامل تغییرات در تن صدا، تغییرات در بلندی، تغییرات در سرعت و کیفیت صوتی است.
این ابزارهای بیانی عمق احساسی و عملکردی را به ارتباطات می‌افزایند و معنای آن‌ها را حتی زمانی که کلمات همانند باقی می‌مانند، تحت تأثیر قرار می‌دهند.

این موضوع یک توسعه جدید نیست. مطالعات نشان می‌دهند که هم شامپانزه‌ها و هم نهنگ‌ها از ساختارهای پروزودیک در ارتباطات خود استفاده می‌کنند، که نشان می‌دهد پروزودی پیش از زبان وجود داشته است. در انسان‌ها، یک مکث می‌تواند معنای یک جمله را به‌طور چشمگیری تغییر دهد.

بررسی لحن گفتار به‌عنوان یک زبان پنهان

دکتر نداو ماتالون و دکتر ایال وینراب، که تحقیق را از آزمایشگاه موسی رهبری می‌کنند، تصمیم گرفتند که پروزودی را مانند یک زبان ناشناخته مطالعه کنند.
آن‌ها به پایگاه‌های داده گسترده‌ای از مکالمات خودجوش انگلیسی مراجعه کردند: CallHome Corpus و Santa Barbara Corpus. آن‌ها به‌جای استفاده از گفتار نوشته‌شده یا تمرین‌شده، زیبایی بی‌نظم مکالمات واقعی را جستجو کردند.

الگوهای ابتدایی لحن گفتار

از این خوشه‌بندی، محققان حدود ۲۰۰ الگوی پروزودیک متمایز کشف کردند. این عدد به‌وضوح با هزاران کلمه در واژگان اصلی زبانی انگلیسی متفاوت است. هر الگوی پروزودی، که حدود یک ثانیه طول می‌کشد، به‌عنوان یک «کلمه» در زبان پنهان لحن عمل می‌کند.

عملکرد زبانشناختی الگوهای لحن گفتار

با وجود تفاوت در صداهای فردی، این اشکال ملودیک به‌طور پیوسته در مکالمات خودجوش ظاهر می‌شوند. هر شکل می‌تواند چندین عملکرد زبانی داشته باشد بسته به زمینه، اما معمولاً یک نگرش عاطفی غالب مانند اشتیاق، بدبینی یا کنجکاوی را بیان می‌کند.

لحن گفتار بر اساس قوانین ساده

محققان فراتر از شناسایی «کلمات» پروزودیک ابتدایی، قوانینی برای نحوه ترکیب این واحدهای ملودیک کشف کردند. آن‌ها دریافتند که برخی از الگوهای پروزودی تمایل دارند در جفت‌ها ظاهر شوند، به‌طوری که یک واحد پیش‌بینی می‌کند واحد بعدی را بر اساس قوانینی ساده و به یادماندنی شبیه به فرایند مارکوف.

گفتار خودجوش در مقابل گفتار نوشته‌شده

یکی از یافته‌های چشمگیر این تحقیق، تفاوت بین گفتار خودجوش و گفتار نوشته‌شده است. زمانی که محققان کتاب‌های صوتی حرفه‌ای را تجزیه و تحلیل کردند، متوجه شدند که گفتار نوشته‌شده فاقد جفت‌های طبیعی پروزودیکی است که در مکالمات رایج وجود دارد.

آینده هوش مصنوعی و درک احساسات

آموزش هوش مصنوعی برای درک پروزودی می‌تواند به‌شدت نحوه تعامل ماشین‌ها با انسان‌ها را تغییر دهد. محققان پیش‌بینی می‌کنند که سیستم‌های آینده قادر خواهند بود نه‌تنها کلمات را پردازش کنند، بلکه سیگنال‌های عاطفی را نیز از لحن‌های گفتار دریافت کنند.

چالش‌ها و جهت‌گیری‌های آینده

این تحقیق اذعان می‌کند که گفتار انسانی دارای نویز درونی است. مکالمات روزمره پر از وقفه‌ها، اصلاحات و صداهای همپوشانی است. خوشه‌بندی الگوهای پروزودیک باید این آشوب را مدیریت کند و جداسازی کامل «کلمات» پروزودیک همچنان دشوار است.

کشف اسرار گفتار

این کار با همکاری تیمی متشکل از دکتر دومینیک فرچه، دکتر اریز فولک از NeuraLight Inc.، دکتر تیرزا بیرون و پروفسور دیوید بیرون از دانشگاه شیکاگو ممکن شده است.
تلاش جمعی آن‌ها اکنون به آینده‌ای اشاره دارد که در آن ماشین‌ها نه‌تنها کلمات را درک می‌کنند بلکه قادر به شنیدن انسان‌ها – احساس، قصد و همه چیز – هستند.

این مطالعه در نشریه Proceedings of the National Academy of Sciences منتشر شده است.

ارتباطات انسانیپروزودیپژوهش علمیزبان پنهانلحن گفتارهوش مصنوعی
0 نظر FacebookTwitterPinterestLinkedinTumblrVKEmail
شهاب الدین حدیدی

شهاب الدین حدیدی هستم، سردبیر فوت و فن. زندگی آنلاین یکی از تفریحات من در زمانیست که از ترافیک و شلوغی و هیاهو در فرار هستم.

مطلب قبلی
تأثیر پنهان آلودگی نوری بر دریاچه‌ها؛ نور ضعیف، اثرات بزرگ
مطلب بعدی
زیر سایه‌ دیجیتالی شدن

شما هم نظر دهید Cancel Reply

برای دفعه بعد که نظر می‌دهم نام و ایمیل من را در این مرورگر ذخیره کنید.

* با استفاده از این فرم، با ذخیره و مدیریت داده‌های خود توسط این وب سایت موافقت می‌کنم.

مطالب مرتبط

  • هوش مصنوعی چگونه علوم گرده و هشدارهای آلرژی...

    21 اردیبهشت 1404
  • آیا آینده می‌تواند گذشته را تغییر دهد؟ کشف...

    20 اردیبهشت 1404
  • چگونه هوش مصنوعی کارایی پاکسازی پلاستیک از اقیانوس‌ها...

    17 اردیبهشت 1404
  • حل بخشی از معمای خطوط نازکا با کمک...

    17 اردیبهشت 1404
  • بازگشت OpenAI به ساختار غیرانتفاعی؛ پیروزی اخلاق بر...

    16 اردیبهشت 1404
  • ویکی‌پدیا قصد ندارد هوش مصنوعی را جایگزین انسان‌ها...

    14 اردیبهشت 1404
  • چگونه هوش مصنوعی زبان بدن اسب‌ها را به...

    14 اردیبهشت 1404
  • چه زمانی هوش مصنوعی مانند انسان استدلال خواهد...

    14 اردیبهشت 1404
  • ویژگی‌های جدید ‏ChatGPT‏ نحوه جست‌وجو و خرید شما...

    13 اردیبهشت 1404
  • جاروبرقی بی‌سیم هوشمند LG A9 AI با مکش...

    13 اردیبهشت 1404
  • یادگیری ربات‌ها از انسان‌ها تنها با یک ویدیو

    12 اردیبهشت 1404
  • ویژگی ‏AI Overviews‏ گوگل در یوتیوب نیز به...

    10 اردیبهشت 1404
  • آیا هوش مصنوعی می‌تواند شیطانی شود؟ بررسی نقش...

    9 اردیبهشت 1404

درباره فوت و فن

درباره فوت و فن

با ما تجربه‌ای جذاب از دنیای اطراف را داشته باشید.

در «فوت و فن»، ما به دنبال راه‌های ساده و کاربردی برای بهبود زندگی هستیم. واژهٔ «فن» در فارسی به معنای «شگرد» و «ترفند» است. ما تلاش می‌کنیم این ترفندها را در زندگی روزمره خود به کار ببریم و مطالبی شگفت‌انگیز و مفید را با شما به اشتراک بگذاریم. هدف ما این است که با به اشتراک گذاشتن تجربیات و آموخته‌های خود، به شما کمک کنیم تا روش‌های جدید و ایده‌های تازه‌ای را در زندگی خود بکار ببرید. با ما همراه باشید تا زندگی را با کمک «فوت و فن»، به یک تجربهٔ خلاقانه و لذت‌بخش تبدیل کنیم.

لینک‌های مفید

تماس با ما

 

تبلیغات در فوت و فن

 

درباره ما

Facebook Twitter Instagram Linkedin Tumblr Youtube Email

حامیان

2010-2025@ - All Right Reserved. Designed and Developed by FOOTOFAN

فوت و فن
  • دانش و فن
    • موبایل و تبلت
    • هوش مصنوعی
    • اپراتورها و وب
    • برنامه و نرم افزار
    • دنیای بازی
    • گوناگون
      • سخت افزار
      • تلویزیون
  • اقتصاد
    • اقتصاد بین الملل
    • بازارها
    • بانکداری و تجارت الکترونیک
    • خودرو
    • وبگردی
    • رپورتاژ
  • ورزش
    • فوتبال
    • موتوری
    • تنیس
  • سبک زندگی
    • سلامت
    • تغذیه
    • طبیعت
    • حیوانات
    • خلاقیت
    • آشپزی
  • گردشگری
    • گردشگری
  • فرهنگ و هنر
    • فیلم و سریال
    • کتاب و مجله
    • آثار باستانی
    • صنایع دستی
  • چند رسانه‌ای
    • عکس
    • ویدیو
    • خودمونی
    • همیاری
  • English