استفاده از پارادایم دنیای بصری برای مطالعه پردازش زبان
مقاله «استفاده از پارادایم دنیای بصری برای مطالعه پردازش زبان» در شماره 137 نشریه Acta Psychologica به چاپ رسیده است.
چکیده
ما ویژگیهای کلیدی پارادایم دنیای بصری را شرح میدهیم و زمینههای تحقیقاتی اصلی را که در آن مورد استفاده قرار گرفته است، مرور میکنیم. در بحث خود تأکید میکنیم که این پارادایم اطلاعاتی را در مورد روشی که کاربران زبان اطلاعات زبانی را با اطلاعات به دست آمده از محیط بصری یکپارچه میکنند، ارائه می دهد.
بنابراین، این پارادایم برای مطالعه یکی از موضوعات کلیدی روانشناسی شناختی کنونی، یعنی تعامل بین پردازش اطلاعات زبانی و بصری مناسب است. با این حال، نتیجهگیری در مورد پردازش زبانی (به عنوان مثال، در مورد فعالسازی، رقابت و زمان دسترسی به بازنماییهای زبانی) در غیاب اطلاعات بصری مرتبط باید با احتیاط انجام شود.
مقدمه
در سال 1974، کوپر از شرکتکنندگان خواست تا در حین تماشای نمایشگرهایی که اشیاء مشترک را نشان میدهند، به روایتهای کوتاه گوش دهند، که برخی از آنها در متن گفتاری به آنها اشاره شده است. به شرکتکنندگان اطلاع داده شد که اندازه مردمک آنها ثبت شده است و میتوانند به هر کجا که میخواهند نگاه کنند. علیرغم این دستورالعملها، کوپر متوجه شد که نگاه شنوندگان به اشیایی جلب میشود که به آنها اشاره شده یا به نوعی با متن مرتبط هستند. به عنوان مثال، شنوندگان با شنیدن «سگ پراکنده من اسکاتی…» بیشتر از سایر قسمتهای متن به تصویر یک سگ نگاه میکردند و با شنیدن «در طول» نگاهشان به تصویر دوربین جلب میشد.
کوپر همچنین متوجه شد که حرکات چشم شنوندگان به شدت با متن قفل شده است، به طوری که بیش از 90٪ از تثبیتها روی اشیاء مهم یا در حین بیان کلمه مربوطه یا در عرض 200 میلیثانیه پس از تغییر کلمه فعال میشوند. کوپر احساس میکرد که “ابزار تحقیقی جدید و عملی برای بررسی لحظهای فرآیندهای ادراکی و شناختی و بهویژه برای مطالعه دقیق ادراک گفتار، حافظه و پردازش زبان” پیدا کرده است. با این حال، مطالعه کوپر تا حد زیادی توسط جامعه روانزبانی برای بیش از بیست سال نادیده گرفته شد (تا سال 1996 فقط هشت بار استناد شد؛ تا سال 2010 105 بار).
تنها پس از آن بود که تاننهاس، اسپایوی-نولتون، ابرهارد و سدیوی (1995) یک مقاله علمی با استفاده از روششناسی مشابه منتشر کردند (همچنین به ابرهارد، اسپایوی-نولتون، سدیوی و تاننهاس، 1995 مراجعه کنید) که روانشناسان شروع به بهرهبرداری از رابطه سیستماتیک بین حرکات چشم و پردازش گفتار در مقیاس بزرگتر.
پارادایم پیشگام کوپر و تاننهوس و همکارانش اکنون به عنوان پارادایم دنیای بصری شناخته میشود (Allopenna, Magnuson, & Tanenhaus, 1998) و تأثیری دگرگون کننده بر حوزه روانشناسی زبانی داشته است. ممکن است کسی بپرسد که چرا مطالعه کوپر مورد توجه قرار نگرفت، در حالی که 20 سال بعد، Tanenhaus و همکارانش. کاغذ چنین تأثیر عظیمی داشت. تا حدودی این ممکن است به این دلیل باشد که تا اواسط دهه نود ردیابی چشم یک تکنیک نسبتاً دست و پا گیر برای استفاده بود.
علاوه بر این، ظهور پارادایم دنیای بصری منعکس کننده توسعه نظری در روانزبانشناسی است. از اوایل دهه هشتاد – زمانی که فودور (1983) مفهوم مدولار بودن ذهن را توسعه داد – یک دغدغه اصلی در روانزبانشناسی این بوده است که تعیین کند چگونه فرآیندهای آموزش زبان و غیرزبانی به طور مشترک درک شنونده یا خواننده از جملات را تعیین میکنند. Tanenhaus و همکارانش اولین کسانی بودند که نشان دادند که پارادایم دنیای بصری ابزار قدرتمندی برای بررسی این موضوع است.
بلافاصله پس از اولین مطالعات درک مطلب، ردیابی چشم نیز برای مطالعه تولید زبان مورد استفاده قرار گرفت (گریفین و بوک، 2000، مایر و همکاران، 1998). اگرچه مطالعات تولیدی معمولاً به عنوان «تحقیق دنیای بصری» نامگذاری نمیشوند، اما شباهتهای آشکاری با مطالعات درک مطلب با استفاده از الگوی دنیای بصری وجود دارد، و بنابراین ما هم مطالعات درک و هم مطالعات تولید را بررسی میکنیم.
ساختار مقاله
- ابتدا ویژگیهای کلیدی پارادایم دنیای بصری را تشریح میکنیم.
- سپس حوزههای تحقیقاتی اصلی را که از آن استفاده شده است، مرور خواهیم کرد.
- در بخش 3، مطالعات جهان بصری را در سطح جمله و گفتمان توصیف و ارزیابی میکنیم.
- در بخش 4 مطالعات را در سطح کلمه مرور میکنیم.
- در بخش 5، سه خط تحقیقات تولیدی را که از ردیابی چشم استفاده کردهاند، مرور میکنیم.
- نکته اصلی در نتیجه گیری ما (بخش 6) و در طول بررسی این است که چگونه وجود اطلاعات بصری مرتبط بر پردازش زبان گفتاری تأثیر میگذارد و در رابطه با این، چه نتیجهگیری میتوان در مورد پردازش زبان گفتاری در موقعیتهای دیگر گرفت.
2. ویژگی های کلیدی پارادایم دنیای بصری
در این بخش، ابتدا (در بخش 2.1.) ویژگیهای معمولی پارادایم را که در مطالعات درک زبان استفاده میشود، مرور میکنیم و سپس در بخش 2.2 به ویژگیهای مطالعات تولید میپردازیم.
2.1. ویژگیهای کلیدی درک درک جهان بصری
2.1.1. نمایش انواع و عبارات گفتاری
راهاندازی اولیه در یک آزمایش جهان بصری درک مطلب ساده است: در هر آزمایش، شرکتکنندگان در حالی که به نمایشگر آزمایشی نگاه میکنند، سخنی را میشنوند. حرکات چشم شرکت کنندگان برای تجزیه و تحلیل های بعدی ثبت میشود.
در یکی از نسخههای رایج این پارادایم، ورودی بصری شامل نقاشیهای خطی از صحنههای نیمه واقعی است که روی صفحه رایانه نشان داده میشود و جملاتی که صحنهها را توصیف میکنند یا درباره آنها توضیح میدهند (به عنوان مثال، «پسر کیک را خواهد خورد»، Altmann & Kamide، 1999 ؛ شکل 1i را ببینید). به طور معمول، نمایشگر شامل اشیایی است که در گفتار ذکر شده است (به عنوان مثال، یک پسر و یک کیک برای مثال قبلی) و اشیاء حواس پرتی که ذکر نشده است.
در نسخه دیگری، نمایشگرها مجموعهای از اشیاء هستند که یا در یک فضای کاری قرار گرفتهاند (مانند Tanenhaus و همکاران، 1995) یا بهعنوان نقاشیهای خطی روی صفحه رایانه نشان داده شدهاند (مثلاً، Allopenna و همکاران، 1998؛ به شکل 1ii مراجعه کنید).
استفاده از صحنههای نیمه واقع گرایانه به محققان این امکان را میدهد که در میان چیزهای دیگر ارزیابی کنند که چگونه درک شنوندگان از صحنه و/یا دانش جهانی آنها در مورد صحنهها و رویدادها بر درک آنها از گفتههای گفتاری تأثیر میگذارد (برای بحث بیشتر رجوع کنید به هندرسون و فریرا، 2004).
وقتی از آرایههایی از اشیاء استفاده میشود، تأثیر چنین دانشی به حداقل میرسد، که آرایهها را برای مطالعه فعالسازی دانش مفهومی و واژگانی مرتبط با کلمات فردی مناسب میسازد.
شکل 1. نمایشهای بصری معمولی در پارادایم دنیای بصری. مثال (i) از Altmann and Kamide (1999) است، مثال (ii) و (iii) از Huettig و McQueen (2007) است.
- (i) نمونهای از یک صحنه نیمه واقعی است (شرکتکنندگان یا شنیدند “پسر کیک را خواهد خورد” یا “پسر کیک را حرکت می دهد”).
- (ii) نمونه ای از نمایشگر چهار شی
- (iii) نمونه ای از نمایش کلمه چاپ شده است.
در مثالهای (ii) و (iii) شرکتکنندگان جملات هلندی «Uiteindelijk keek ze naar de beker die voor haar stond» را شنیدند (در نهایت او به فنجانی که در مقابلش بود نگاه کرد).
در برخی از مطالعات، ابتدا یک نمایش بصری نشان داده شد، و یک جمله گفتاری به دنبال آن، در حالی که یک صفحه خالی نشان داده شد. چنین تنظیمی برای بررسی اثرات حافظه بصری کوتاه مدت بر نگاه چشمی با واسطه زبان مفید است.
مطالعات روی صفحه خالی نشان داده است که افراد تمایل دارند نواحی روی صفحه خالی را که قبلاً توسط اشیاء مرتبط اشغال شده بود، دوباره تثبیت کنند و این نشان میدهد که حرکات چشم با واسطه زبان مشروط به حضور یک آیتم بصری در طول آن بیان نیست (به آلتمن مراجعه کنید). ، 2004، آلتمن و کامید، 2007، فریرا و همکاران، 2008، نوفرل و کروکر، 2007، ریچاردسون و همکاران، 2009، ریچاردسون و اسپایوی، 2000، اسپایوی و گنگ، 2001).
اخیراً یک نسخه کلمه چاپی از پارادایم دنیای بصری ایجاد شده است (Huettig and McQueen, 2007, McQueen and Viebahn, 2007؛ به شکل 1iii مراجعه کنید). تنها تفاوت با نسخه استاندارد این است که تصاویر با کلمات چاپ شده جایگزین میشوند.
یک مزیت مهم نسخه چاپی کلمه این است که محرکهای بصری نیازی به نمایش اشیاء عینی ندارند، بلکه میتوانند هر کلمه ای باشند. Huettig و McQueen (2007) پیشنهاد کردند که نسخه چاپی کلمه ممکن است نسبت به نسخه سنتی با استفاده از تصاویر حساس تر به دستکاری های واجی باشد.
نتایج به دست آمده توسط وبر، ملینگر و لارا تاپیا (2007) این دیدگاه را تایید می کند. Salverda و Tanenhaus (2010) دریافتند که نوع کلمه چاپی ابزار مفیدی برای بررسی پردازش املایی در طول ادراک گفتار است. در مقابل، به نظر میرسد که بررسی پردازش نمایشهای معنایی و (مفهومی) شکل بصری نسبت به نسخه استاندارد حساسیت کمتری دارد (Huettig & McQueen, 2008).
بسیاری از مطالعات دنیای بصری بررسی کردهاند که آیا مواردی که از نظر واجشناسی، معنایی یا بصری با یک هدف مرتبط هستند، توجه را به خود جلب میکنند یا خیر. برای این منظور، گاهی اوقات مفید است که نمایشگرهای فاقد هدف را اضافه کنیم که شیء ذکر شده در جمله همراه را ندارند. به عنوان مثال، Huettig و Altmann (2005) نشان دادند که این امر احتمال مشاهده اثرات رقابت را بسیار افزایش میدهد (شکل 2 در Huettig & Altmann، 2005 را ببینید).
2.1.2. زمان بندی محرک
محققان اغلب علاقه خاصی به آنچه در طول یا بلافاصله پس از ارائه یک کلمه انتقادی در جریان گفتار رخ میدهد، دارند. از آنجایی که این کلمه معمولاً در یک جمله حامل ظاهر میشود (“روی < کلمه انتقادی> یا “پسربچه < کلمه انتقادی>… کلیک کنید”) شرکتکنندگان چند ثانیه فرصت دارند تا قبل از شروع آن با اشیاء آشنا شوند.
معمولاً ارائه نمایش بصری همزمان با یا اندکی (مثلاً 1 ثانیه) قبل از شروع گفتار شروع میشود و تا پایان گفتار در معرض دید قرار میگیرد. مقدار پیش نمایش داده شده مهم است. Huettig و McQueen (2007) نشان دادند که احتمال تثبیت اشیاء خاص به زمانی بستگی دارد که شرکت کنندگان برای بازیابی بازنمایی های مربوطه در مورد اشیاء در نظر گرفته شده بودند.
2.1.3. وظیفه صحبت شده
گفتهها میتوانند دستورالعملهایی برای شرکتکنندگان باشند (وظایف «عمل مستقیم»، به عنوان مثال، «آب نبات را بردارید»، آلوپنا و همکاران، 1998) یا توصیفها یا نظرات صرف روی نمایشگر (کارهای «نگاه و گوش دادن»، به عنوان مثال، آلتمن و Kamide، 1999، Huettig و Altmann، 2005). در مورد دوم، اغلب از شرکت کنندگان خواسته می شود که به صفحه نگاه کنند و با دقت به جملات گوش دهند. انتخاب تکلیف به سؤالات تجربی بستگی دارد (برای بحث بیشتر به Huettig، Olivers و Hartsuiker، این شماره؛ Salverda، Brown و Tanenhaus، این شماره، را ببینید). به عنوان مثال، وظایف «نگاه و گوش دادن» به محققان این امکان را میدهد تا ارزیابی کنند که آیا تأثیرات خاص (مثلاً رقابت) یک ویژگی کلی تر از تعاملات زبان- بینایی است یا اینکه آیا آنها به خواسته های خاص خاصی محدود میشوند.
مزیت پارادایم دنیای بصری در مقایسه با سایر پارادایمهای روانزبانی مانند لکهگیری کلمات، تصمیمگیری واژگانی و قضاوتهای دستوری (نگاه کنید به شماره ویژه زبان و فرآیندهای شناختی، گروسژان و فراونفلدر، 1996) این است که شنوندگان مجبور نیستند هیچ متا را اجرا کنند. – قضاوت های زبانی، که ممکن است استخراج آن از سوی برخی گروه های شنونده (مثلاً کودکان خردسال) دشوار باشد و ممکن است بر نحوه پردازش گفتار تأثیر بگذارد. پارادایم دنیای بصری تنها بر تمایل شنوندگان برای نگاه کردن به بخشهای مربوطه از نمایشگر آنطور که ذکر شده است متکی است.
ممکن است سؤال شود که چرا شنوندگان به اشیایی که ذکر شده یا ضمنی مینگرند؟ تعجب آور نیست که شرکت کنندگان وقتی از آنها خواسته می شود که آنها را لمس یا حرکت دهند به آنها نگاه میکنند. چنین کارهایی با تثبیت روی شی به آسانی انجام میشود (همچنین به تحقیق در مورد حرکات چشم در طول کارهای روزمره مانند تهیه یک فنجان چای، مانند لند، منی و رستد، 1999؛ ایروین، 2004 مراجعه کنید). با این حال، شنوندگان همچنین در مواقعی که نیازی به اقدام آشکار نیست، به اشیاء هدف نگاه می کنند. به احتمال زیاد آنها قصد دارند گفتار گفتاری را با ورودی بصری مرتبط کنند (به عنوان مثال، آلتمن و کامید، 2007).
شاید آنها این کار را به این دلیل انجام میدهند که این نوع نقشهبرداری در بسیاری از زمینههای روزمره مورد انتظار و سودمند است، بهعنوان مثال وقتی یک کتاب درسی شامل نمودارها و شکلها را مطالعه میکنیم؛ وقتی به مربی گوش میدهیم که یک مهارت جدید را توضیح میدهد و نشان میدهد (مثلاً کاشت پیاز گل لاله یا برشته کردن). یک اردک)، یا زمانی که پیشبینی آب و هوا را از تلویزیون تماشا میکنیم. اغلب رسانههای گفتاری و تصویری اطلاعات تکمیلی را ارائه میدهند و پردازش آنها با هم مفید است. ارتباط دادن اطلاعات دیداری و گفتاری با یکدیگر به آسانی با هدایت توجه بصری – و نگاه چشم – به اشیاء مربوطه حاصل میشود. این به این دلیل است که توجه به یک شی نه تنها تشخیص شیء را تسهیل میکند، بلکه فعال کردن هرگونه اطلاعات مرتبط، از جمله، بهعنوان مثال، نام شی را نیز تسهیل میکند (به عنوان مثال، Malpass & Meyer, 2010).
این که آیا ادغام ورودی بصری و گفتاری یک فرآیند عمدی یا خودکار است یا خیر، باید دید. حسابهای تأثیرگذار کنونی، خودکار بودن را بهعنوان یک پیوستار در نظر میگیرند (مثلاً، لوگان، 1985) و از این دیدگاه حمایت میکنند که خودکار بودن را میتوان با نگاه کردن به وجود یا عدم وجود ویژگیهای ترکیبی مانند عمدی، کنترلپذیری؛ وابستگی به هدف، کارایی؛ و اینکه آیا فرآیند به بهترین شکل تشخیص داد. مورد بحث صرفاً محرک، ناخودآگاه و سریع است (برای بررسی جامع به مور و د هوور، 2006 مراجعه کنید).
آلتمن و کامید (2007) پیشنهاد کردهاند که افزایش در فعالسازی بازنمایی ذهنی یک شی و مکان آن (به عنوان مثال، با ورودی زبانی) منجر به افزایش احتمال حرکت ساکادیک چشم به سمت این مکان میشود. Huettig و همکاران (این موضوع، رجوع کنید به Knoeferle and Crocker, 2006, Spivey et al., 2004) پیشنهاد کردند که حافظه کاری بهعنوان پیوندی عمل میکند که در آن بازنماییهای بصری و زبانی بلندمدت (یعنی انواع) به مکانهای خاص (یعنی نشانهها یا شاخصها) متصل میشوند. .
این مشابه چیزی است که آلتمن و کامید (2007) بهعنوان ردپای اپیزودیک تجربه یک شی توصیف میکنند (“شامل مکان آن و بازنماییهای مفهومی مرتبط با آن تجربه”، ص 512). تفاوت اصلی این است که Huettig و همکاران. فرض کنید که حافظه فعال شرط لازم برای این تجربه است (برای بحث بیشتر به Huettig et al.، این موضوع مراجعه کنید) در حالی که Altmann و همکارانش (Altmann & Mirkovi ć، 2009) استدلال میکنند که حافظه فعال بهعنوان یک مکانیسم خارجی مورد نیاز نیست “زیرا توجه در همان بستر بازنمایی اطلاعات زبانی و غیرزبانی (همچنین نگاه کنید به کوهن، استون جونز؛ و گیلزنرات، 2004) ” و بنابراین “حالتهای مختلف این بستر بازنمایی نشان دهنده مدولاسیون توجه است که حرکات چشم را هدایت میکند” (ص. 593) نمونه سازی شده است).
در مجموع، حرکات چشم شنوندگان در طول آزمایش یک آزمایش دنیای بصری، جهت توجه بصری آنها را منعکس میکند که هم به ورودی دیداری و هم به ورودی شنیداری بستگی دارد. به عبارت دیگر، اگرچه پارادایم دنیای بصری معمولاً برای مطالعه درک گفتار استفاده میشود، اما حرکات چشم شنوندگان منعکس نمیشود.
دقیقاً پردازش زبانی آنها، اما به پردازش بصری آنها نیز بستگی دارد. بنابراین، برای مثال، می توان تصور کرد که یک کلمه هدف زودتر در یک آزمایش دنیای بصری شناسایی شود، جایی که بازنمایی واج شناختی آن نه تنها با گفتار گفتاری، بلکه همچنین با نمایش تصویری مرجع فعال می شود (مانند مایر و دامیان، 2007، مورسلا و میوزو، 2002، ناوارت و کوستا، 2005)، نسبت به عدم وجود نمایش بصری از شی مرجع. اگرچه این ممکن است کاملاً بدیهی به نظر برسد، از نظر ما، روشهایی که اطلاعات دیداری و شنیداری به طور مشترک توجه و نگاه را تعیین میکنند، در ادبیات مورد توجه کافی قرار نگرفته است. ما در طول این بررسی به این موضوع باز خواهیم گشت.
2.1.4. شرکت کنندگان
در اکثر مطالعات جهان بصری، شرکت کنندگان به صورت جداگانه مورد آزمایش قرار گرفتهاند، اما برخی از مطالعات نیز وجود دارد که افراد را در گفتگو مورد آزمایش قرار میدهد. در این مطالعات از همفکرانی استفاده شده است که به شرکت کنندگان آموزش میدهند (مانند هانا و همکاران، 2003، کیسار و همکاران، 2000)، شرکت کنندگان ساده لوحی که نقش شنونده یا سخنران به آنها اختصاص داده شده است (مانند اسندکر و تروزول، 2003)، یا شرکت کنندگان در همکاری مشترک. بازیها (به عنوان مثال، براون اشمیت، گانلوگسون؛ و تاننهاس، 2008، به بخش 3. 2 مراجعه کنید). شرکتکنندگان در مطالعات جهان بصری عمدتاً دانشجویان مقطع کارشناسی بودهاند، اما این الگو در گروههای بیمار نیز استفاده شده است (تامپسون و چوی، 2009؛ والش و همکاران، 2007، یی و همکاران، 2008) و در نوجوانان (بروک و همکاران. ، 2008، مک موری و همکاران، 2010). البته ارتباط نزدیکی با الگوی نگاه ترجیحی دارد که اغلب در مطالعات توسعه مورد استفاده قرار میگیرد (گولینکف، هیرش پاسک، کولی و گوردون، 1987، همچنین نگاه کنید به آریاس – ترجو و پلانکت، 2010، سوینگلی و فرنالد، 2002، جانسون و Huettig، 2011، Nation و همکاران، 2003، Trueswell و همکاران، 1999).
2.1.5. تحلیل دادهها
تجزیه و تحلیل دادهها در مطالعات دنیای بصری بر این سؤال تمرکز میکند که چقدر احتمال دارد شرکتکنندگان به مناطق خاص مورد علاقه در زمانهای مختلف در طول آزمایش نگاه کنند. انتخاب مناطق مورد علاقه و پنجرههای زمانی به سؤال تحقیق بستگی دارد. بهعنوان مثال، مناطق مورد علاقه ممکن است نقاشیهای یک شی هدف ذکر شده در بیان و یک شی حواس پرتی با نام صدای مشابه باشد؛ و پنجرههای زمانی ممکن است 100 میلی ثانیه اپیزود باشد که از شروع نام شروع میشود. شی مورد نظر متداولترین متغیرهای وابسته، نسبتهای تثبیت بر روی نواحی مورد علاقه در طول هر پنجره زمانی یا تعداد ساکادها نسبت به مناطق مورد علاقه هستند که در طول هر پنجره زمانی آغاز شدهاند (به عنوان مثال، آلتمن، 2004).
سؤالات معمول برای تجزیه و تحلیلهای آماری این است که آیا دو منطقه مورد علاقه در احتمال بازرسی در طول هر یک از مجموعهای از پنجرههای زمانی متوالی متفاوت هستند (به عنوان مثال، چمبرز و همکاران، 2002، Huettig و McQueen، 2007)، یا اینکه آیا منطقهای از علاقه (مثلاً یک کیک) در شرایط آزمایشی (مثلاً وقتی با یک فعل دلالت میکند، مانند «پسر میخورد…») زودتر از یک شرط کنترلی ( «پسر حرکت میکند…» نگاه میشود. بهعنوان مثال، آلتمن و کامید، 1999). در بیشتر مطالعات، نسبتهای تثبیتها یا ساکادها در آزمونهای t یا آنالیز واریانس (اغلب پس از تبدیلهای مناسب) مقایسه میشوند. این تجزیه و تحلیلها ثابت کردهاند که کاملاً قوی هستند (همانطور که از تکرارهای موفق متعدد مشهود است).
با این حال توجه داشته باشید که دادههای دنیای بصری برخی از مفروضات اساسی ANOVAها را نقض میکند (به Barr, 2008a, Barr, 2008b مراجعه کنید). فرض استقلال مشاهدات نقض میشود اگر پنجره زمانی بهعنوان یک عامل در نظر گرفته شود زیرا تثبیتهای یکسان ممکن است به پنجرههای زمانی متعدد کمک کند. فرض توزیع نرمال و فرض متغیر پیوسته ممکن است نقض شوند اگر نسبتها (یعنی دادههای طبقه بندی) متغیر وابسته باشند. رویکردهای آماری جایگزین مانند رگرسیون لجستیک چند سطحی (Barr, 2008a, Barr, 2008b), تجزیه و تحلیل لگ خطی (Huettig & Altmann, 2005؛ برای بحث به هاول, 2002, Scheepers, 2003) و تجزیه و تحلیل منحنی رشد (Mir) مراجعه کنید. دیکسون؛ و مگنوسون، 2008) به طور فزایندهای برای دادههای دنیای بصری استفاده میشوند (همچنین به شماره ویژه مجله حافظه و زبان، جلد 59، 2008 مراجعه کنید).
یک مسئله آماری جدیتر مربوط به اثرات پایه است. به عنوان مثال، یک شی خاص (به عنوان مثال، یک رقیب برای هدف) ممکن است قبل از دسترسی به اطلاعات مهم از قول گفتاری ثابت شود. چنین سوگیریهایی باید در تجزیه و تحلیل آماری اصلاح شوند (به Barr, Gann, & Pierce، این شماره مراجعه کنید).
هنگام تفسیر نتایج مطالعات جهان بصری، مهم است که به خاطر داشته باشید که تثبیتها و ساکادها رویدادهای نسبتاً مجزایی هستند. بنابراین دادههای یک آزمایش نمیتواند اطلاعاتی در مورد پردازش مداوم سیگنال گفتار، به عنوان مثال، فعال شدن تدریجی نامزدهای کلمه یا غیرفعال شدن تدریجی رقبا ارائه دهد. با این حال، با میانگین گیری در بین کارآزماییها و شرکتکنندگان، میتوان محاسبه کرد که شنوندگان به طور متوسط در یک لحظه معین از زمان، چقدر احتمال دارد که به هر یک از مناطق نگاه کنند.
مورد علاقه بر اساس این دادهها، استنباطهایی در مورد سیر زمانی فرآیندهای شناختی زیربنایی میتوان به دست آورد.1 به طور فزایندهای، نتایج آزمایشهای دنیای بصری نه تنها برای اطلاعرسانی مدلهای توصیفی پردازش زبان، بلکه برای توسعه و آزمایش مدلهای محاسباتی استفاده میشود (Allopenna) و همکاران، 1998، مایبری و همکاران، 2009، میرمن و مگنوسون، 2009، مک موری و همکاران، 2010، روی و موکرجی، 2005؛ همچنین به استفان، میرمن، مگنوسون و دیکسون، 2009 مراجعه کنید.
2.2. ویژگیهای کلیدی مطالعات تولید
در مطالعات تولید، شرکتکنندگان مجموعههایی از اشیاء (به عنوان مثال، گریفین، 2001، مایر و همکاران، 1998) یا کارتونهایی از رویدادها یا کنشها را مشاهده میکنند (به عنوان مثال، گلیتمن و همکاران، 2007، گریفین و باک، 2000، گریفین و اوپنهایمر، 206). ). هیچ ورودی گفتاری ارائه نمیشود، اما در عوض از شرکت کنندگان خواسته میشود آنچه را که میبینند توصیف کنند. گاهی اوقات، دستورالعملهای دقیق در مورد گفتههای مورد انتظار ارائه میشود.
بهعنوان مثال، ممکن است از سخنرانان خواسته شود که اشیاء را به ترتیبی خاص (مثلاً از چپ به راست) در عبارات اسمی بدون نام گذاری کنند. مایر و همکاران، 1998)؛ و گاهی اوقات از سخنرانان به سادگی خواسته میشود آنچه را که میبینند توصیف کنند (گریفین و باک، 2000). همانطور که در مطالعات درک مطلب، نگاه چشم شرکت کنندگان نظارت میشود. محققان معمولاً تعیین میکنند که کدام اشیاء بازرسی میشوند، به چه ترتیبی بازرسی میشوند و چه زمانی نسبت به خروجی گفتار شرکت کنندگان بازرسی میشوند. همانطور که بعداً با جزئیات بیشتری نشان داده خواهد شد، این اطلاعات در مورد روشهایی که گویندگان تولید طرحهای گفته را با بیان آشکار هماهنگ میکنند، ارائه میدهد.
علاوه بر این، محققان اغلب تعیین میکنند که چه مدت به هر جسم خیره میشود. پس از بررسی مطالعات درک مطلب، بعداً (بخش 5) نشان خواهیم داد که مدت زمان نگاه گوینده به یک شی، نشانگر خوبی از زمانی است که آنها برای شناسایی شی و ایجاد جملاتی در مورد آن نیاز دارند.
3. مطالعات درک زبان در سطح جمله و گفتمان
3.1. پردازش جمله
یک بحث کلیدی در مطالعه درک زبان این است که چگونه و چه زمانی کاربران زبان انواع مختلف اطلاعات را ادغام میکنند. دو دیدگاه نظری متضاد وجود دارد. بر اساس گزارشهای ساختاری (یا دو مرحلهای)، تجزیه اولیه یک جمله توسط شنونده یا خواننده منحصراً بر اساس اطلاعات نحوی است. انواع دیگر اطلاعات (به عنوان مثال، اطلاعات لغوی و عملی) تنها در مراحل بعدی تأثیر خود را اعمال میکنند (فریزر، 1979، فریزر، 1987).
بر اساس نظریههای تعاملی (به عنوان مثال، تایلر و مارسلن – ویلسون، 1977)، اطلاعات غیر نحوی میتوانند بلافاصله بر پردازش جمله تأثیر بگذارند. تأثیرگذارترین نوع مدلهای تعاملی در حال حاضر، نظریههای مبتنی بر محدودیت هستند (مکدونالد و همکاران، 1994، مکری و همکاران، 1998، تروزول و همکاران، 1994). حسابهای مبتنی بر محدودیت فرض میکنند که پردازش نحوی دارای ویژگیهای مشابه پردازش واژگانی است (مکدونالد و همکاران، 1994، تروزول و همکاران، 1994) و از طریق ارضای محدودیتهای متعدد انجام میشود. اینها شامل محدودیتهای واژگانی، ساختاری و سطح گفتمانی است. محدودیتهای واژگانی (مثلاً ترجیحات ساختار استدلال و فراوانی همروی کلمات در یک عبارت) با این حال فرض میشود که محدودیتهای قویتری نسبت به محدودیتهای ساختاری یا گفتمانی ایجاد میکنند (به عنوان مثال، Trueswell & Tanenhaus، 1994). بسیاری از تحقیقات دنیای بصری در مورد پردازش جمله و گفتمان به تمایز بین نظریههای ساختاری و مبتنی بر محدودیت اختصاص یافته است.
3.1.1. محدودیتهای بصری (و دیگر) در پردازش جمله گفتاری
قبل از مطالعه اصلی توسط Tanenhaus و همکاران. (1995) بیشتر تحقیقات روانزبانی پردازش جمله بر بررسی زمانهای خواندن تکیه داشت. بنابراین دستکاریهای متنی محدود بودند و معمولاً شامل تغییر جمله یا گفتمان قبلی میشدند (برای بررسی، به Frazier، 1995، MacDonald و همکاران، 1994 مراجعه کنید). با این حال، بسیاری از منابع اطلاعاتی دیگر وجود دارد که کاربران زبان به طور بالقوه میتوانند در تعاملات روزانه خود از آنها استفاده کنند، از جمله، بهعنوان مثال، اطلاعات بصری که معنای مورد نظر گفتهها را محدود میکند. برای بررسی زمانی که شنوندگان از چنین اطلاعاتی استفاده میکنند، Tanenhaus و همکارانش جملاتی مانند “سیب را روی حوله در جعبه قرار دهید” به شرکت کنندگان ارائه کردند، که در آن اولین عبارت اضافه (“روی حوله” در مثال) به طور موقت بین آنها مبهم است. نشان دهنده مقصد سیب یا مکان فعلی آن است. در شرایط تک مرجع آزمایش، شرکت کنندگان فقط یک سیب روی یک حوله، یک حوله خالی، یک جعبه و یک مداد دیدند.
در شرایط دو مرجع دو سیب وجود داشت: یکی روی حوله و دیگری روی یک دستمال. در این شرایط یک اصلاح کننده لازم بود تا به شنونده اطلاع دهد که کدام یک از دو سیب باید جابجا شود. بر اساس گزارشهای ساختاری حل ابهام نحوی (فرازیر، 1987)، عبارت “روی حوله” در ابتدا باید بهعنوان مقصد سیب تفسیر شود، صرف نظر از بافت بصری، زیرا این سادهترین تحلیل نحوی جمله از نظر ساختاری است. این باید خود را در خیلی زود به حوله خالی نگاه میکند. با این حال، Tanenhaus و همکاران. (1995) دریافتند که به طور قابل توجهی نگاههای اولیه به حوله خالی در شرایط یک مرجع نسبت به حالت دو مرجع وجود دارد. این شواهد قوی است که بر خلاف گزارشهای دو مرحلهای پردازش جمله، شنوندگان میتوانند بلافاصله از اطلاعات بصری برای ابهامزدایی از ساختار جمله استفاده کنند.
تروزول و همکاران (1999) مطالعه مشابهی را با بزرگسالان و کودکان پنج ساله انجام داد. برای بزرگسالان، آنها اثر زمینه نشان داده شده توسط Tanenhaus و همکاران را تکرار کردند، اما کودکان به همان اندازه به حوله خالی در شرایط یک مرجع و دو مرجع نگاه می کردند. بنابراین، آنها در استفاده از اطلاعات متنی هنگام پردازش جملات شکست خوردند. Trueswell و Gleitman (2004) استدلال کردند که کودکان خردسال می توانند از بافت بصری برای هدایت انتخاب نحوی استفاده کنند، اما آنها برای کشف سودمندی چنین اطلاعاتی به زمان نیاز دارند زیرا نشانه های متنی همیشه وجود ندارند و تمایل دارند نسبت به نشانه های نحوی کمتر قابل اعتماد باشند.
Snedeker و Trueswell (2004) شواهد بیشتری ارائه کردند مبنی بر اینکه حل ابهام نحوی از طریق ارضای محدودیت های متعدد انجام می شود. شرکت کنندگان جملات مبهمی مانند “خوک را با بادبزن غلغلک دهید” یا “گاو را با چوب انتخاب کنید” را در شرایط یک مرجع و دو مرجع شنیدند. آنها دریافتند که درجه ترجیح برای تفسیر ابزار (به جای تفسیر تعدیل کننده) از عبارت مبهم، که به طور مستقل ارزیابی می شود، نگاه چشم را تعدیل می کند. این نتایج از این دیدگاه حمایت می کند که هم محدودیت های زبانی و هم زمینه بصری می توانند تحلیل نحوی اولیه جملات را تعیین کنند. علاوه بر این، آنها نشان میدهند که تأثیر نشانههای خاص ممکن است در طول توسعه تغییر کند.
چمبرز، تاننهوس، و مگنوسون (2004) نمایش چشمگیر خاصی از تأثیرات اولیه زمینه ای ارائه کردند. شرکت کنندگان دستورالعمل هایی مانند “تخم مرغ را در کاسه روی آرد بریزید” شنیدند. چمبرز و همکاران (2004) دریافتند که شرکت کنندگان بلافاصله «در کاسه» را به عنوان تعدیل کننده تفسیر کردند وقتی صحنه حاوی دو تخم مرغ به شکل مایع بود (یکی در یک لیوان، دیگری در یک کاسه)، همانطور که با نگاه های کمی به یک کاسه خالی آشکار شد (‘ هدف اشتباه) با این حال وقتی صحنه حاوی یک تخم مرغ مایع (در یک کاسه) و یک تخم مرغ جامد (در یک لیوان) بود، شرکت کنندگان انتظار داشتند که عبارت “در کاسه” محل مورد نظر برای تخم مرغ قابل ریختن (یعنی آرد) باشد. همانطور که با افزایش نگاه به شی “هدف کاذب” (یعنی کاسه خالی) آشکار می شود. بنابراین مقرون به صرفههای سازگار با کنش، بر اولین لحظات پردازش نحوی تأثیر گذاشت.
آرنولد، کایزر و همکارانش (به عنوان مثال، آرنولد، 2001، آرنولد، آیزنبند، و همکاران، 2000، کایزر و همکاران، 2009، کایزر و تروزول، 2008) از پارادایم دنیای بصری برای مطالعه تفسیر ضمایر استفاده کردند (مثلاً. او/او)، نمایشگرها (مثلاً این و آن)، و بازتاب دهنده ها (مثلاً خودش/خود). مطابق با نظریههای تعاملی، این مطالعات شواهدی را ارائه کردند که وضوح مرجع به محدودیتهای چندگانه حساس است (به عنوان مثال، ساختار اطلاعات، نقش نحوی، و ترتیب کلمات)، که تأثیر آنها در اشکال آنافوری متفاوت است. به عنوان مثال، قیصر و همکاران. (2009) دریافت که تفکیک ضمایر بیشتر تحت تأثیر اطلاعات معنایی (و کمتر تحت تأثیر نحوی) قرار دارد تا تفسیر انعکاسی. بنابراین این مطالعات تعامل پیچیده ای از عوامل نحوی و معنایی را در طول تفکیک مرجع پیشنهاد می کنند (همچنین به براون اشمیت و همکاران، 2004، براون اشمیت و همکاران، 2005 مراجعه کنید).
در مجموع، مطالعات جهان بصری بررسی شده در این بخش، پشتیبانی قوی از حسابهای مبتنی بر محدودیت از پردازش جمله ارائه میکنند. تا آنجا که ما می دانیم هیچ مطالعه ای در جهان بصری شواهدی را گزارش نکرده است که از حساب های ساختاری پشتیبانی می کند. با این حال، شواهدی برای تأثیر فوری محدودیتهای متعدد در موقعیتهای دیگر (مثلاً در حین خواندن) ترکیبیتر به نظر میرسد (به کلیفتون و استاب، 2008، کلیفتون و همکاران، 1994، کلیفتون و همکاران، 2003، ون گومپل و پیکرینگ مراجعه کنید، 2001، Van Gompel و همکاران، 2005، برای بحث؛ اما شواهد ERP Hagoort و همکاران، 2004، Sereno و همکاران، 2003 را ببینید). به عنوان مثال، میچل (2004، ص 22) استدلال کرده است که «سوالات جدی در مورد میزانی وجود دارد که مطالعات دنیای بصری می توانند بر پردازش جملات متناوب با زمینه اصلی روشن کنند، و درجه ای که نتایج صرفاً انواع آن را منعکس می کند. پردازشی که در حضور آرایه های شی خاص رخ می دهد» (ص 22). ما در طول بررسی به این سوال باز خواهیم گشت.
3.1.2. درک پیشبینی کننده
یک خط تحقیق مرتبط توسط آلتمن و همکارانش آغاز شد. در اینجا شنوندگان صحنههای نیمه واقعی را میبینند و جملاتی را در مورد آنها میشنوند. سؤال کلیدی این است که چگونه و چه زمانی اطلاعات زبانی جملات گفتاری (مثلاً “او بطری را برمی دارد و شراب را با دقت در لیوان میریزد”) با اطلاعات بازیابی شده از محیط بصری (مثلا صحنهای که یک زن را به تصویر میکشد) یکپارچه میشود. یک میز، یک بطری شراب،
و یک لیوان خالی). این کار (i) اهمیت پیشبینی را در طول پردازش زبان نشان داده است و (ii) نشان داده است که حرکات چشم با واسطه زبان نه تنها منعکسکننده پردازش زبانی است، بلکه بهروزرسانی مداوم بازنماییهای ذهنی در حال تغییر پویا از رویدادی که صحنه و گفتار است را نیز منعکس میکند. قول رجوع به. آلتمن و کامید (1999) به شرکت کنندگان صحنههای بصری نیمه واقع گرایانهای را ارائه کردند که بهعنوان مثال، یک پسر، یک کیک و برخی اسباب بازیها را به تصویر میکشد (شکل 1i را ببینید) در حالی که آنها جملاتی مانند “پسربچه کیک را حرکت میدهد” یا “پسر خواهد کرد” را شنیدند. پسر کیک را خواهد خورد.» آنها دریافتند که حرکات چشم روی کیک (تنها شیء خوراکی در صحنه) در حالت “خوردن” به طور قابل توجهی زودتر از حالت “حرکت” شروع شد.
آلتمن و کامید (1999) این نتیجه را بهعنوان شواهدی تفسیر کردند که اطلاعات انتخابی منتقل شده توسط یک فعل را میتوان برای پیش بینی یک موضوع آتی مورد استفاده قرار داد. Kamide، Altmann و Haywood (2003) بررسی کردند که آیا فقط اطلاعات فعل میتواند برای پیش بینی آنچه در ادامه به آن ارجاع داده میشود استفاده شود یا اینکه ترکیب اطلاعات فعل با موضوع دستوری قبلی میتواند حرکات چشم را پیش بینی کند. هنگامی که شرکتکنندگان با شنیدن «مرد سوار میشود…» تثبیتهای بیشتری به موتورسیکلت پیدا کردند، اما وقتی شرکتکنندگان «دختر سوار خواهد شد…»، تثبیتها به چرخ و فلک افزایش یافت.
بنابراین، اطلاعات ارائه شده توسط موضوع دستوری و توسط فعل میتواند به طور مشترک حرکات چشم انتظاری را محدود کند (همچنین به Kamide، Scheepers و Altmann، 2003 مراجعه کنید، برای شواهدی مبنی بر اینکه اطلاعات نشانه گذاری مورد میتواند برای پیش بینی استفاده شود). آلتمن و کامید (2007) نشان دادند که از اطلاعات تنشی برای تفسیر مرجع مورد اشاره استفاده میشود. شرکت کنندگان آنها تمایل داشتند با شنیدن جمله گذشته «مرد مشروب خورده است…» به یک لیوان خالی شراب نگاه کنند، اما با شنیدن «مرد مینوشد…» به یک لیوان پر آبجو نگاه کنند.
اخیراً آلتمن و کامید (2009) نشان دادند که حرکات چشم انتظاری و همزمان شنوندگان نه چندان به ویژگیهای ورودی گفتاری و صحنه بصری بستگی دارد، بلکه بیشتر به بازنمایی ذهنی که شنوندگان هنگام پردازش محرکها در طول زمان میسازند، بستگی دارد (ر. ک. کایزر و تروزول، 2004). شرکتکنندگان هنگام تماشای صحنهای که یک زن، یک بطری شراب و یک لیوان شراب روی زمین بود، جملاتی مانند «زن لیوان را روی میز میگذارد» یا «زن تنبلتر از آن است که لیوان را روی میز بگذارد» شنیدند. یک میز خالی سپس شنیدند “زن بطری را برمی دارد و شراب را با احتیاط در لیوان میریزد”. در آزمایش 1 نمایشگر روی صفحه باقی ماند، در آزمایش 2 قبل از شروع جمله با یک صفحه خالی جایگزین شد. با شنیدن «ریختن»، شرکتکنندگان در هر دو آزمایش اغلب به محل شیشهای که گفته میشود (یعنی روی زمین یا روی میز) نگاه میکردند. بنابراین، این مطالعات نشان میدهد که حرکات چشم با واسطه زبان، بازنمایی رویدادهای به روز شده پویا را منعکس میکند (همچنین رجوع کنید به Knoeferle and Crocker، 2006، Knoeferle and Crocker، 2007؛ و Knoeferle و همکاران، 2005، برای کارهای مرتبط با نقش اطلاعات بصری و دانش جهانی در تضاد است. رویدادها در تفسیر جملات؛ و Mishra & Singh، 2010، برای کار بر روی درک حرکت ساختگی).
در مجموع، شنوندگان از انبوهی از اطلاعات زبانی و همچنین بصری برای ابهامزدایی از ساختارهای مختلف جمله و پیشبینی ورودی زبانی آینده استفاده میکنند. حرکات چشم با واسطه زبان نه تنها پردازش زبانی و نه فقط پردازش صحنه بصری را منعکس میکنند، بلکه بازنمایی ذهنی به روز شده پیوسته بر اساس اطلاعات به دست آمده از ورودیهای زبانی و بصری را منعکس میکنند.
پارادایم دنیای بصری ابزار بسیار مفیدی برای بررسی پردازش شناختی ثابت کرده است: تحلیلهای نحوی، پیشبینیها و بازنمایی رویدادهای شرکتکنندگان را میتوان از جهت نگاه چشم آنها استنباط کرد. با این حال، یک موضوع مهم این است که چگونه نتایج در پارادایم دنیای بصری با تحلیلهای نحوی، پیشبینیها و بازنمایی رویدادها در غیاب ورودی بصری مرتبط است. همانطور که Kamide، Altmann و همکاران. (2003)، توضیح میدهد که “پس آنچه ما نمیدانیم این است که آیا برای قطعهای مانند “مرد سوار میشود… “، پردازنده نمایشهایی را در هنگام سواری فعال میکند که مطابق با محدوده اشیاء قابل سواری است که یک مرد ممکن است حتی در آن سوار شود.
عدم وجود یک زمینه بصری همزمان که یک یا چند چیز قابل سوار شدن را به تصویر میکشد. بنابراین، پارادایم به ما اجازه نمیدهد که تعیین کنیم آیا ساختار زبانی است که یک فرآیند پیشبینی را آغاز میکند، زیرا نحو تعیین میکند که چیزی در شرف ارجاع است، یا اینکه این بافت بصری است که به پردازنده پیشنهاد میکند که ممکن است چیزی به طور معقولی وارد یک رابطه موضوعی با مرد، به واسطه عمل سوارکاری، شوید. نیازی به گفتن نیست که ما دادههایی نداریم که بهصورت تجربی به این تمایز بپردازند.» (ص 151؛ همچنین به Kamide، 2008؛ و Kamide، Scheepers و همکاران، 2003، برای بحث در مورد این موضوع مراجعه کنید). آنچه این مطالعات نشان میدهد چیست شنوندگان میتوانند انجام دهند، نه آنچه را که واقعاً در زمینههای دیگر انجام میدهند.
3.2. عمل شناسی و گفتگو
خط دیگری از تحقیقات، پارادایم جهان بصری را برای مسائل عمل شناسی به کار برده است: مطالعه جنبه هایی از تفسیر که فراتر از معناشناسی است و نیاز به استنتاج درباره زمینه و اهداف گوینده دارد. سه موضوع اصلی عملگرایانه مورد بررسی قرار گرفتهاند: استفاده از زمینه برای تفسیرهای خاص موقعیت، دوره زمانی استنتاجهای عملگرایانه، و استفاده از زمینههای مشترک در موقعیتهای گفتگو.
3.2.1. تفسیر موقعیت خاص
پارادایم جهان بصری، به دلیل ماهیت خود، زمینه بصری را برای شرکت کنندگان فراهم میکند که با توجه به آن میتوان ورودی زبانی را تفسیر کرد. چمبرز و همکاران (2002) نشان داد که این زمینه بلافاصله برای تفسیرهای خاص موقعیت از حروف اضافه استفاده میشود: داخل در “مکعب را در داخل قوطی قرار دهید” باعث شد شرکت کنندگان بلافاصله توجه بصری خود را نه فقط به ظروف، بلکه به طور خاص به ظروف که به اندازه کافی بزرگ بودند محدود کنند.
برای نگه داشتن مکعب خاص موجود در زمینه بصری. حافظه اپیزودیک موقعیت نیز میتواند درک مطلب را راهنمایی کند. چمبرز و سان خوان (2008) نشان دادند که وقتی شرکت کنندگان یک شی را به مکان دیگری در یک شبکه منتقل میکردند، فعل بازگشت (به عنوان مثال، “بازگرداندن چکمه به منطقه سه”) منجر به آزارهای پیش بینی شده برای این شی که قبلاً جابجا شده بود، میشود. این امر تأیید میکند که پیشبینیهای شنوندگان نه تنها بر اساس ویژگیهای پایدار اشیاء است (مانند قابل خوردن، Altmann & Kamide، 1999)، بلکه میتواند بر اساس دانش اپیزودیک در مورد وضعیت موجود نیز باشد. ارتباط ارتباطی این اثر پیشبینی را محدود میکند: در یک آزمایش بعدی که یک وظیفه ارتباطی ارجاعی را به کار میبرد، تنها زمانی پیدا شد که شنونده معتقد بود که جابجایی شی توسط گوینده که دستورالعملها را میدهد شناخته شده است. بنابراین، پارادایم دنیای بصری برای بررسی تأثیرات موقعیتی بر پردازش زبان مناسب است.
3.2.2. استنتاج عملی
مطالعات متعددی از این پارادایم برای پرداختن به دوره زمانی استنتاجهای عمل گرایانه استفاده کردهاند، با تمرکز بر اصول کلاسیک گریس (گریس، 1975) مانند حداکثر کمیت: ارائه اطلاعات به اندازه لازم و نه بیشتر. این اصل حکم میکند که از توصیف بیش از حد باید اجتناب شود. در واقع، انگلهارت، بیلی و فریرا (2006) دریافتند که توصیف بیش از حد منجر به حرکات چشم میشود که نشان دهنده سردرگمی در سمت شنونده است. از سوی دیگر، سخنرانان نباید اطلاعات کمی ارائه دهند: ارجاع به یک لیوان خاص در زمینه عینکهای دیگر باید شامل اطلاعاتی باشد که شیشه مورد نظر را به طور منحصر به فردی از عینکهای دیگر متمایز کند (به عنوان مثال، یک صفت: “شیشه بلند”). . Sedivy، Tanenhaus، Chambers و Carlson (1999) نشان دادند که وقتی چنین صفتی توسط گوینده ارائه میشود، نشانه عملی به سرعت در نظر گرفته میشود.
با شنیدن «لیوان بلند را بردارید»، شرکتکنندگان سریعتر نگاه چشم خود را به سمت شی مورد نظر هدایت میکردند، زمانی که یک «شیعه کنتراست» (یک لیوان کوتاه) نیز در نمایشگر وجود داشت تا زمانی که هیچ جسم کنتراست در صفحه نمایش وجود نداشت. آنها این کار را در زمان شروع اسم یا حتی قبل از آن انجام دادند و از دیدگاههای افزایشی پردازش زبان پشتیبانی میکردند که در آن استنتاجهای عملگرایانه به سرعت استخراج میشوند. یک مطالعه اخیر (گرودنر و سدیوی، در حال چاپ) نشان داد که این استنتاج کنتراست تنها زمانی انجام میشود که گوینده قابل اعتماد باشد: در مورد یک سخنران غیرقابل اعتماد که «مشکلات زبانی و اجتماعی» را جعل میکند، شرکتکنندگان از این تضاد کمکی نمیکردند، این نشان میدهد که که فرآیندهای مورد استفاده در این مطالعات به جای استفاده خودکار دانش ذخیره شده از قراردادها، استنتاجهای عملی واقعی بودند.
حتی اگر استنباطهای عملی ممکن است به سرعت استخراج شوند، در مراحل اولیه به احتمال زیاد درجاتی از پردازش واژگانی – معنایی ضروری است (یعنی ممکن است بین پردازش واژگانی – معنایی و عملی تاخیر وجود داشته باشد). هوانگ و اسندکر (2009a) به منظور استفاده از این رابط معنایی – عمل شناسی، از شرکت کنندگان خواستند که در حین مشاهده نمایشگری که در آن یک دختر دو تا از چهار جوراب داشت به جملاتی مانند “به دختری که جوراب دارد اشاره کنید” گوش دهند؛ و یک دختر دیگر سه توپ از سه توپ فوتبال (یک رقیب همپوشانی با شروع واجی) داشت. معنای واژگانی «بعضی» به کمیت بیشتر از یک دلالت میکند (یعنی بعضی و احتمالاً همه)، اما این کلمه معمولاً با یک «مرز بالایی» (یعنی بعضی و نه همه) از طریق یک تعبیر میشود.
استنباط عمل گرایانه: «بعضی» به معنای همه نیست، زیرا اگر گوینده در موقعیتی بود که «همه» را بگوید، از «بعضی» استفاده نمیکرد. آنها دریافتند که نسبت نگاهها به هدف در هنگام ارائه «بعضی» کمتر از جایگزینی آن با همه یا با اعداد (دو و سه) بود که دارای معنای دقیق هستند (هوانگ، اسپلکه و اسندکر، 2005). این نشان میدهد که محاسبه استنتاجهای عملی زمان میبرد. در واقع، به جای محاسبه استنتاج عملی، شرکت کنندگان منتظر ماندند تا اطلاعات صوتی هدف را ابهام بخشد (توپهای فوتبال یا جوراب؛ به Panizz مراجعه کنید.
a، Chierchia، Huang & Snedeker، در حال چاپ، برای نتیجه مشابه)، اما با گذشت زمان بیشتر بین معرفی ابهام و ابهامزدایی، استنباط متأخر قابل مشاهده بود (Huang & Snedeker، در حال چاپ). دیدگاهی که در آن استنباط عملگرایانه زمانبر و بالقوه پرتلاش است، توسط تحقیقات توسعهای نیز پشتیبانی میشود که نشان میدهد کودکان پنجساله نمیتوانند استنتاجهای عملگرایانه خاصی را استخراج کنند و فقط محتوای معنایی کمیسازها را تفسیر میکنند (هوانگ و اسندکر، 2009b).
با این حال، یک مطالعه اخیر نشان داد که پشتیبانی زمینهای کافی، از جمله دستورالعملی که برجستگی مجموعه آیتمها را افزایش میدهد، میتواند تاخیرهای استنتاج عملی را حذف کند (Grodner, Klein, Carbary, & Tanenhaus, 2010) و این امکان را ایجاد میکند که افزایش زمان پردازش برای صفتهای اسکالر مشاهده شده در مطالعات قبلی نه در سطح استنتاج، بلکه در سطح ادغام استنتاج با زمینه ایجاد میشوند.
3.2.3. گفتگو
مجموعه دیگری از تحقیقات پارادایم دنیای بصری را در موقعیتهای گفتگو به کار برده است. براون اشمیت و تاننهاس (2008) یک وظیفه ارتباطی ارجاعی را به کار گرفتند که در آن جفت شرکتکنندگان با هم مجموعهای از اشیاء را ترتیب میدادند که هر کدام بر روی تابلوی خود بودند. آنها فرض کردند که هماهنگی که در طول مکالمه پدیدار میشود و بهعنوان تسهیل کننده درک شناخته میشود (به عنوان مثال، شوبر و کلارک، 1989) حوزه ارجاعی را به ناحیه کوچکی از تابلو محدود میکند؛ و این میتواند به صورت آنلاین مشاهده شود.
در واقع، پس از شنیدن یک اسم (مثلاً ابر)، نگاه به رقبای گروه (مثلاً دلقک) در طول مکالمه بدون اسکریپت در مقایسه با دستورالعملهای آزمایشگر (مثلاً «به ابر نگاه کن») بسیار کمتر شد، که نشان میدهد رقبای گروه خارج از محدوده بودند. دامنه ارجاعی ایجاد شده در مکالمه (مثلاً از طریق اکتشافی مرتبط با کار یا نزدیکی به آخرین شیء ذکر شده) در مقایسه با دستورالعملهای آزمایشگر که در آن چنین دامنه ارجاعی مشخص نشده است.
پارادایم دنیای بصری همچنین برای مطالعه نحوه استفاده سخنرانان و شنوندگان از دانش مشترک یا زمینه مشترک استفاده شده است. این پارادایم به اشیاء اجازه میدهد تا در زمین مشترک، قابل مشاهده برای هر دو شرکت کننده، یا در زمین ممتاز، قابل مشاهده برای تنها یکی از شرکت کنندگان قرار گیرند. این ویژگی برای بررسی اینکه در کدام نقطه از زمان از زمین مشترک برای حل ارجاعات مبهم استفاده میشود، استفاده شده است. به عبارت دیگر، آیا ما فوراً دانش طرفین خود را در نظر میگیریم یا این یک فرآیند دیرهنگام و شاید پر زحمت است؟
برخی از مطالعات شواهدی برای استفاده فوری مخاطبان از زمینه مشترک ارائه کردند. هانا و همکاران (2003) به شرکت کنندگان دستورالعملهایی مانند “حالا مثلث آبی را روی مثلث قرمز قرار دهید” ارائه کرد. صفحه نمایش، به غیر از هدف (مثلث قرمز در زمین مشترک)، مثلث قرمز دیگری بود که در زمین ممتاز مخاطب قرار داشت (یعنی فقط مخاطب میتوانست آن را ببیند). Hanna، Tanenhaus و Trueswell مشاهده کردند که 400 ms پس از شروع صفت (“قرمز”) مخاطبین در مقایسه با رقیب زمینی ممتاز، احتمال بیشتری برای نگاه کردن به هدف مشترک در زمین داشتند (همچنین نگاه کنید به Hanna & Tanenhaus، 2004؛ و موارد مشابه. اثرات با کودکان پنج و شش ساله، Nadig & Sedivy، 2002). بنابراین، مخاطبان به سرعت زمینههای مشترک را در نظر میگیرند و ترجیح میدهند به اشیایی که گوینده میتواند ببیند، در مقابل اشیایی که گوینده نمیتواند ببیند و بنابراین نمیتوانست به آنها رجوع کند، ترجیح میدهند.
در مقابل، مطالعات دیگر از این ایده حمایت میکنند که مخاطبان درک را به طور کامل به زمینههای مشترک محدود نمیکنند؛ و حتی گاهی اوقات مراجع را در زمینه ممتاز خود انتخاب میکنند. بهعنوان مثال، در مطالعهای توسط کیسار و همکاران. (2000) مخاطبین مجبور بودند دستورات گوینده را برای جابجایی اشیاء در یک آرایه تفسیر کنند. در آزمایشهای بحرانی، سه نوع از یک شی در آرایه وجود داشت (به عنوان مثال، یک شمع کوچک، یک متوسط؛ و یک شمع بزرگ، همراه با یک حواسپرنده نامرتبط)، با یک شی (مثلاً کوچکترین شمع) در آرایه مخاطبین زمین ممتاز؛ وقتی از مخاطبان خواسته شد که «شمع کوچک» را جابجا کنند، مخاطبان زمانی که رقیب بود (مثلاً کوچکترین شمع) در زمین ممتاز، در مقایسه با زمانی که حواسپرتی بود، طولانیتر و بیشتر به آن نگاه میکردند.
کیسار و همکاران دریافتند که در یک پنجم از آزمایشها، شنوندگان حتی شی ناخواسته را جابهجا میکنند؛ و نشان میدهد که آنها گاهی از یک اکتشافی «خودمحور» استفاده میکنند که زمینههای مشترک را در نظر نمیگیرد (کیسار، لین؛ و بار، 2003، برای یک نتیجه مشابه؛ برای بررسی، به Barr & Keysar، 2006 مراجعه کنید.
با این حال، نگاه به مراجع در زمینه ممتاز نیز میتواند نشان دهد که زمینه مشترک در واقع در نظر گرفته شده است: هنگامی که از شنوندگان سؤالی در مورد شیئی که شریک نمیتواند ببیند پرسیده میشود، مناسب است که موجودیتها را در زمین ممتاز بررسی کنید. براون اشمیت و همکاران (2008) به شرکت کنندگان دستور داد تا نقاشیهای حیوانات را با لوازم جانبی مختلف در یک آرایه مجدداً مرتب کنند، در حالی که برخی از شکافها در آرایه برای یکی از شرکت کنندگان مسدود شده است؛ وقتی از مخاطبان سؤال شد یک سؤال (مثلاً «بالای گاو با کلاه چیست؟»)، احتمال بیشتری داشت که نگاه خود را به سمت شکافهای (ممتاز) خود معطوف کنند تا شکافهای مشترک در زمینهای مشترک. این به سرعت پس از شروع کلمه انتقادی (به عنوان مثال، “گاو”) اتفاق افتاد، که نشان میدهد شنوندگان بلافاصله بین زمینه مشترک و ممتاز تمایز قائل میشوند.
این مطالعات نشان میدهد که چگونه میتوان از پارادایم ردیابی چشم جهان بصری برای مطالعه فرآیندهای سطح بالا که نقش مهمی در مکالمات طبیعی بازی میکنند، استفاده کرد. با این حال، با توجه به استفاده طرفین از زمینههای مشترک، نتایج تا حدودی متناقض است. دلایل متعددی برای این عدم همگرایی در ادبیات پیشنهاد شده است. بهعنوان مثال، برخی از مطالعات که استفاده اولیه از زمینه مشترک را نشان میدهند، از پارادایمهای تعاملی با دو شرکتکننده سادهلوح استفاده کردهاند (به عنوان مثال، براون اشمیت و همکاران، 2008)، در حالی که مطالعاتی که دیدگاهی در ابتدا خود محوری را نشان میدهند، از یک کارگردان همسو استفاده کردهاند (کیسار و همکاران، 2000) یا جملات از پیش ضبط شده همراه با یک داستان پوششی با هدف متقاعد کردن شرکت کنندگان که به یک شرکت کننده ساده لوح گوش میدهند که از طریق دستگاه مخابره داخلی با آنها صحبت میکند (Barr, 2008a, Barr, 2008b). پیشنهاد شده است که استفاده از کنفدراسیون ممکن است «بسیاری از فرآیندهای مشترک طبیعی را که در مکالمه تعاملی رخ میدهند» حذف کند (Tanenhaus & Brown-Schmidt, 2008, p. 1114) و اینکه «اثرات دیدگاه احتمالاً در کارهایی قویتر است.
شرکت کنندگان اهداف مشترکی دارند، زمینههای مشترک به طور مشترک ایجاد میشود؛ و تبادل اطلاعات توسط هر دو طرف مذاکره میشود. در واقع، شواهدی وجود دارد که نشان میدهد شرکتکنندگان در تعامل با دیگر شرکتکنندگان سادهلوح بهطور سیستماتیکتر به حساب میآورند تا با همفکران (به شوبر و برنان، 2003، برای بحث براون و دل، 1987؛ و لاکریج و برنان، 2001 مراجعه کنید). براون اشمیت (2009a) همچنین نشان داد که یک اثر تسهیلکننده خاص شریک آنلاین از «اصطلاحات تعبیهشده» (نامهای مشترک که در طول مکالمه ایجاد میشوند) تنها در طول یک کار تعاملی و نه در گوش دادن به ضبطها به دست میآید؛ و دوباره از این ایده حمایت میکند که تعامل در ارزیابی اثرات زمینه مشترک مهم است. با این حال، تعامل نمیتواند همه اختلافات بین مطالعات را توضیح دهد، زیرا برخی از مطالعات که اثرات اولیه زمینه مشترک را نشان میدهد، از گفتههای همفکری (هانا و تاننهاس، 2004، هانا و همکاران، 2003) یا تا حدی متنی (هلر، گرودنر؛ و تاننهاس، 2008) استفاده میکنند.)
پیشنهاد دیگر این است که نوع ابهام مورد استفاده ممکن است تفاوتها را توضیح دهد. بهعنوان مثال، هانا و همکاران. (2003) از اشیاء یکسان (به عنوان مثال، مثلث قرمز) در زمین مشترک و ممتاز استفاده کرد. در این مورد؛ ورودی زبانی هرگز مرجع را ابهام نمیکند و بنابراین باید با دانش زمینه مشترک مشورت کرد، شاید شنوندگان را تشویق به کنار گذاشتن هرگونه استراتژی خود محوری کند (همانطور که Barr, 2008a, Barr, 2008b, p. 20 پیشنهاد کرد). در مقابل، کیسار و همکاران. (2000) از آیتمهای مشترک متفاوتی در مقایسه با زمین ممتاز استفاده کرد، با این که آیتم در زمین ممتاز همیشه بهترین تطابق را با ورودی زبانی داشت (به عنوان مثال، هنگامی که دستور حرکت دادن شمع کوچک، کوچکترین شمع در زمین ممتاز بود؛ و شمعها در زمینه مشترک اندازه متوسط (هدف) و اندازه بزرگ بود. همانطور که هانا و همکاران اشاره کردند. (2003، ص 45)، این تطابق میتوانست نادیده گرفتن موارد در زمین ممتاز را برای مخاطبان دشوارتر کند.
دو مطالعه (بار، 2008 الف، بار، 2008 ب، هلر و همکاران، 2008؛ مشابه براون اشمیت و همکاران، 2008) دستکاری ظریف تری را انجام دادند: ابهامات موقت. هلر، گرودنر و تاننهاس (2008) (ر. ک. Sedivy et al., 1999) به شنوندگان دستور دادند که مرجع یک عبارت را با صفت مقیاسی بیابند (مثلاً “اردک بزرگ را بردارید” در حالی که یک اردک بزرگ و یک اردک کوچک حضور دارند. در زمینه مشترک همراه با «تضاد رقیب» (مثلاً یک جعبه بزرگ و یک جعبه کوچک) در زمین ممتازشان.
شنوندگان هدف (مثلاً اردک بزرگ) را پیشبینی میکردند در حالی که علیرغم وجود تضاد رقیب، «بزرگ» را میشنیدند. در مقابل، Barr, 2008a, Barr, 2008b دریافتند که وقتی شنوندگان با یک عبارت ارجاع موقت مبهم (مثلاً سطل) مواجه میشوند، میزان تداخل یک رقیب واج شناختی (مثلاً سگک) ) بدون در نظر گرفتن اینکه رقیب در زمین مشترک یا ممتاز بود معادل بود. قبل از شروع عبارت ارجاع، شرکت کنندگان ترجیحاً به اشیاء مشترک نگاه میکردند؛ اما ظاهراً این اطلاعات در طول دوره بعدی مورد استفاده قرار نگرفت. فرآیندهای خروج (برای مشاهده مشابه به کیسار و همکاران، 2000، آزمایش 2 مراجعه کنید). در حال حاضر، مشخص نیست که آیا تفکیک مشابهی بین پیشبینی و یکپارچگی نیز میتواند نتایج هلر و همکاران را توضیح دهد. شاید مطالعهای با ترکیب صفت اسکالر و دستکاریهای همگروهی بتواند این موضوع را روشن کند. در نهایت، متفاوت است.
نتایج بین نتایج به دست آمده در مطالعات موجود ممکن است به دلیل تفاوت در نمونههای آزمایش شده باشد. براون اشمیت (2009b) نشان داد که تفاوتهای فردی در توانایی کنترل بازدارنده، حساسیت مخاطبان به زمینههای مشترک را پیشبینی میکند: هر چه کنترل بازدارندگی شرکتکنندگان بهتر باشد، کمتر احتمال دارد که بر رقبا متمرکز شوند.
به طور کلی، اختلاف در نتایج مطالعات مشابه دوباره بر اهمیت استفاده کنندگان از پارادایم دنیای بصری تأکید میکند که دقیقاً چگونه اطلاعات زبانی ناشی از انواع ابهامات و اطلاعات بصری توسط ترکیبات مختلف اشیاء در بصری ارائه میشود. نمایش، همراه با جنبههای اجتماعی وضعیت آزمون ممکن است بر نتایج تأثیر بگذارد.
3.3. عروض و ناروانی
چندین مطالعه از الگوی دنیای بصری برای بررسی چگونگی استفاده از ویژگیهای سیگنال گفتار برای هدایت وضوح ابهام نحوی و تجزیه و تحلیل ساختار اطلاعات استفاده کردهاند. اولین مورد از این ویژگیها مربوط به ویژگیهای عروضی جملات است و سایر ناروانیها.
با توجه به خط تحقیق در مورد عروض، Dahan، Tanenhaus و Chambers (2002) نشان دادند که شنوندگان میتوانند از لحن برای تعیین اینکه آیا گوینده یک مرجع جدید معرفی میکند یا دوباره به مرجع ذکر شده قبلی اشاره میکند (به عنوان مثال، “شمع را بالای صفحه قرار دهید” استفاده کنند. مثلث. حالا شمع را بگذارید… “). آنها دریافتند که شنوندگان از لهجه صمیمی حروف صدادار برای مستقیم نگاه کردن به چشم استفاده میکنند: شرکتکنندگان هنگام شنیدن کلمات با حروف صدادار تاکیدی تمایل داشتند به یک شی جدید (یا غیر متمرکز) نگاه کنند، در حالی که وقتی کلماتی را با حروف صدادار بدون تکیه میشنیدند، تمایل داشتند به شیء جدید (یا غیر متمرکز) نگاه کنند. موضوعی که قبلاً ذکر شد (یا برجستهترین)؛ وبر، براون و کراکر (2006) (همچنین به Ito & Speer، 2008 مراجعه کنید) نشان دادند که شنوندگان نگاه چشم خود را زودتر به سمت تصویر مرجع متعلق به یک جفت کنتراست (“قیچی قرمز”، زمانی که قیچی قرمز و قیچی بنفش در آن وجود داشت تغییر دادند. نمایش) زمانی که لهجه متضاد روی صفت وجود داشت نسبت به زمانی که صفت تاکید نداشت (همچنین به Watson، Tanenhaus و Gunlogson، 2008 مراجعه کنید).
Snedeker و Trueswell (2003) نشان دادند که عروض بر تفسیر شنوندگان از عبارات مبهم نحوی (مثلاً “به قورباغه با گل ضربه بزنید”) حتی قبل از شروع حرف اضافه پیوسته مبهم تأثیر میگذارد. بنابراین، مشابه استفاده از اطلاعات نحوی و معنایی و دانش جهانی (به بخش 3. 1 مراجعه کنید)، به نظر میرسد که شنوندگان میتوانند از اطلاعات عروضی برای پیشبینی ورودیهای زبانی آینده استفاده کنند. به طور کلی، این مطالعات نشان میدهد که شنوندگان میتوانند نشانههای عروضی و زمینه بصری را برای تعیین مرجع مورد نظر ترکیب کنند؛ و این کار را بلافاصله انجام میدهند، در حالی که ورودی گفتاری هنوز در طول زمان آشکار میشود.
خط دیگری از تحقیقات نقش ناروانی سخنران را بررسی کرده است. آرنولد، آلتمن، فاگنانو و تاننهوس (2004) بررسی کردند که آیا شنوندگان از افزایش احتمال ناهمخوانی سخنرانان استفاده میکنند (به عنوان مثال، به جای شمع، شمع تو را میگویند) در حالی که به اطلاعات جدید در مقایسه با اطلاعات داده شده اشاره میکنند (Arnold، Wasow، Losongco)؛ و Ginstrom، 2000) بهعنوان نشانهای برای ساختار اطلاعات گفته. آنها دریافتند که در مقایسه با گفتار روان، ناروانیها منجر به نگاههای بیشتر به موضوعات جدید گفتمانی میشود.
علاوه بر این، دستورالعملهای ناهمگون منجر به نگاههای کمتری به یک رقیب همگروهی (مثلاً شتر) از یک هدف گفتمانشده (مثلاً شمع) در مقایسه با دستورالعملهای روان شد (همچنین به آرنولد، فاگنانو و تاننهاس، 2003 مراجعه کنید). این دادهها نشان میدهند که ناروانیها مخاطب را نسبت به در نظر گرفتن اشیاء گفتمان جدید بهعنوان مرجع سوگیری میکنند. بار و سیف الدینی پور (2010) این سوگیری را در یک مطالعه ردیابی موش با استفاده از صدای زن و مرد بررسی کردند و دریافتند که این سوگیری مختص گوینده است: سوگیری نه تنها به داده بودن از دیدگاه شنونده، بلکه به آنچه بستگی دارد. برای گوینده فعلی قدیمی و جدید بود. آرنولد، هادسون کام و تاننهاس (2007) نشان دادند که علاوه بر سوگیری نسبت به اشیاء جدید، ناهمواریها همچنین میتوانند منجر به سوگیری برای نگاه کردن به اشیاء ناآشنا در مقایسه با اشیاء آشنا شوند. این تأثیر زمانی کاهش یافت که به شرکت کنندگان گفته شد که گوینده از اگنوزیا شی رنج میبرد، که نشان میدهد اثر آشنایی منعکس کننده استنباط شرکت کنندگان در مورد علت ناروانی است.
با تکیه بر یافتههای قبلی مبنی بر اینکه ناهمواریها به احتمال زیاد قبل از یک مؤلفه نحوی پیچیده رخ میدهند (به عنوان مثال، هاوکینز، 1971)، بیلی و فریرا (2007) بررسی کردند که آیا ناهمسانیها بهعنوان نشانههایی برای ابهامزدایی ساختارهای نحوی استفاده میشوند یا خیر، آنها جملاتی را با ناهماهنگی در ساختارهای نحوی ارائه کردند. موقعیتهای مختلف (به عنوان مثال، «سیب را روی حوله در جعبه قرار دهید» در مقابل «سیب را روی حوله اوه اوه در جعبه قرار دهید»). اگرچه شرکتکنندگان اقدامات درخواستی را به درستی انجام دادند، اما بیشتر به حولهای نگاه کردند که در اواخر در یک جعبه قرار داده شده بود تا شرایط ناهمخوانی اولیه، که منعکس کننده استفاده از ناروانی برای ابهامزدایی از ساختار نحوی است.
در مجموع، مطالعات قبلاً مورد بحث قرار گرفت، بخشی از یک روند کلی (همچنین در کار بر روی زمینههای مشترک بررسی شده در بخش قبل منعکس شده است) برای فراتر رفتن از گفتههای متنی و بررسی چگونگی درک مردم از گفتههای طبیعیتر است. تاکنون نتایج نشان میدهد که شنوندگان از جنبههایی از سیگنال گفتار که به طور سنتی مرتبط تلقی نمیشدند، مانند ناروانیها، بهعنوان نشانههایی برای فرآیندهای زبانی اصلی مانند حل ابهام نحوی و تحلیل ساختار اطلاعات استفاده میکنند.
3.4. نسبیت زبانی
رابطه بین زبان و شناخت تقریباً 100 سال است که به شدت مورد بحث بوده است. رفتارگرایان (به عنوان مثال؛ واتسون، 1925) تمایل داشتند که باور کنند که زبان و تفکر اساساً یک چیز هستند. مطالعه میان زبانی باعث شد تا زبان شناسان و انسان شناسان پیشنهاد کنند که تفکر توسط عوامل خاص زبان تعیین میشود (به گامپرز و لوینسون، 1996، لوسی، 1992، ساپیر، 1921؛ وورف، 1956 مراجعه کنید). در مقابل، دانشمندان علوم شناختی معمولاً فرض میکنند که زبان از ادراک و شناخت متمایز است (مانند چامسکی، 1957، چامسکی، 1965). اخیراً محققان شروع به بررسی تجربی این موضوع کردهاند.
بهعنوان مثال، در حوزه رنگ، شواهدی جمع آوری شده است که نشان میدهد زبان به طور غیرارادی در طی کارهای ادراکی ساده به کار گرفته میشود (به عنوان مثال، دیویدوف و همکاران، 1999، گیلبرت و همکاران، 2006، رابرسون و همکاران، 2000، تان و همکاران. ، 2008؛ ویناور و همکاران، 2007). در مقابل، در حوزه حرکت، هیچ اثر زبان بر شناخت یافت نشد (ر. ک. جناری و همکاران، 2002، پاپافرگو و همکاران، 2002، پاپافرگو و همکاران، 2006). پارادایم دنیای بصری یک رویکرد تجربی امیدوارکننده برای بررسی این موضوع است.
پاپافرگو، هالبرت و تروزول (2008) بررسی کردند که چگونه گویشوران بومی یونانی و انگلیسی هنگام مشاهده رویدادهای حرکتی توجه خود را به خود اختصاص میدهند. یونانی و انگلیسی زبانهایی هستند که در رمزگذاری حرکت محدود متفاوت هستند: یونانی زبانان تمایل دارند از افعال مسیر (مانند صعود و عبور) استفاده کنند، اما انگلیسی زبانان عمدتاً از افعال شیوه (مانند سر خوردن، راه رفتن و دویدن) استفاده میکنند. پاپافرگو و همکاران (2008) حرکات چشم شرکتکنندگانی را که رویدادهای حرکتی را در طول دو کار مشاهده میکردند، ثبت کرد، یک وظیفه توصیف شفاهی و یک کار حافظه (مشاهده آزاد). در طول تکلیف توصیف شفاهی، تفاوتهای متقابل زبانی معنیداری یافت شد. سخنرانان به مؤلفههای رویداد که معمولاً به زبان آنها کدگذاری شده بود، نگاه کردند. با این حال، در طول کار حافظه (مشاهده آزاد) تفاوتی در نگاه چشم مشاهده نشد. پاپافرگو و همکاران (2008) به این نتیجه رسیدند که تأثیر زبان بر شناخت تنها زمانی ایجاد میشود که زبان برای دستیابی به کار به کار گرفته شود، اما به طور کلی در طول ادراک رویداد نه.
پاپافرگو و تروزول (2010) حرکات چشم گویشوران بومی یونانی و انگلیسی را تحت شرایط بار شناختی مقایسه کردند. هنگامی که رمزگذاری رویداد دشوار بود، زیرا شرکتکنندگان ملزم به شرکت در یک کار غیرزبانی همزمان (ضربه زدن) بودند، آنها به مؤلفههای رویداد که مشخصه در زبانشان کدگذاری شده بود، بیشتر نگاه میکردند (یعنی انگلیسیزبانان ترجیح میدادند نقطه پایان مسیر را به جای نحوه منطقه حرکت بررسی کنند. در حالی که یونانی زبانان الگوی مخالف را نشان دادند). این اثر خاص زبان در زمانی که کار همزمان وجود نداشت یا زمانی که کار همزمان نیاز به استفاده از زبان داشت (شمارش با صدای بلند) وجود نداشت.
در آزمایش دوم، کار همزمان (شمارش با صدای بلند) به تأخیر افتاد (یعنی شرکتکنندگان 3 ثانیه فرصت داشتند تا قبل از شروع شمارش، رویداد حرکت را بررسی کنند) و جلوههای خاص زبان درست قبل از درگیر شدن در کار ظاهر شد (اما نه قبل از آن) . به طور کلی، این دادهها نشان میدهند که تأثیرات خاص زبان بر توجه تنها در موقعیتهای معدودی پدیدار میشوند و به دشواری درک شرکتکنندگان از کار مرتبط است. پاپافرگو و تروزول (2010) به این نتیجه رسیدند که زبان را میتوان به صورت اختیاری برای رمزگذاری رویدادها به کار گرفت، اما عوامل خاص زبان، سوگیریهای اصلی را در درک رویداد و حافظه شکل نمیدهند.
Huettig، Chen، Bowerman و Majid (2010) مسائل مشابهی را با بررسی اینکه چگونه طبقهبندیکنندههای اعداد ماندارین، یک مقوله دستوری در آن زبان، بر نگاه چشم شنوندگان تأثیر میگذارند، بررسی کردند. اگر دستهبندیکنندههای خاص زبان بر پردازش تأثیر میگذارند، شرکتکنندگان با شنیدن اسم هدف باید توجه آشکار را به اشیایی معطوف کنند که طبقهبندیکننده یکسانی دارند، حتی زمانی که طبقهبندیکننده بهصراحت در جریان گفتار وجود ندارد. بهعنوان مثال، با شنیدن کلمه ماندارین برای قیچی، آنها باید بیشتر به تصویر یک صندلی نگاه کنند تا تصویر یک شی غیر مرتبط، زیرا اسامی قیچی و صندلی دارای طبقهبندی ba3 هستند. هنگامی که سخنرانان ماندارین جملهای را میشنیدند که شامل طبقه بندی کننده بود (مثلاً “قیچی ba3 “) به طور قابل توجهی بیشتر به اشیاء منطبق کننده طبقه بندی کننده (مثلاً صندلی) نگاه میکردند تا به اشیاء حواس پرت کننده. با این حال؛ وقتی طبقهبندیکننده در جمله گفتاری وجود نداشت (مثلاً «قیچی»)، اشیاء مطابق با طبقهبندی (مثلاً صندلی) نسبت به اشیاء حواسپرتی ثابت نمیشوند. این نشان میدهد که تمایز طبقه بندی کننده بر رفتار نگرش چشم تأثیر میگذارد.
ior، اما فقط زمانی که طبقه بندی کنندهها در جریان گفتار وجود داشته باشند. بنابراین این مطالعه نشان میدهد که تأثیرات خاص زبان بر توجه بصری تنها زمانی ایجاد میشود که تمایز خاص زبان تولید یا درک شود، اما نه لزوماً در شناخت بهطور کلیتر (ر. ک. اسلوبین، 1996، اسلوبین، 2003).
4. مطالعات پردازش زبان در سطح کلمه
تعداد زیادی از تحقیقات جهان بصری بر پردازش واژگانی متمرکز شده است. حوزههای اصلی مورد علاقه عبارتند از پردازش واجشناختی و پردازش جزئیات آوایی ظریف، تشخیص دو زبانه کلمه، تأثیرات بافت بر تشخیص واژه گفتاری، پردازش معنایی و مفهومی سطح کلمه؛ و سطوح بازنمایی که در آن بازنماییهای مشتق شده بصری با مشتقشده از زبان تطبیق داده میشوند. بازنمایی در طول تعاملات زبان و بینایی.
4.1. پردازش آوایی / آوایی
مسائل کلیدی در این زمینه، دوره زمانی و پویایی تشخیص کلمات گفتاری؛ و پردازش نشانههای آوایی و جزئیات آوایی است. بهعنوان مثال، آلوپنا و همکاران. (1998) بررسی کرد که آیا در حین تشخیص کلمه گفتاری، نامزدهای واژگانی بالقوه با شروع ناهماهنگ فعال میشوند یا خیر (یعنی آیا با شنیدن «بشق»، کلماتی مانند «گوینده» نیز فعال میشوند). مدتهاست که شناخته شده است که نامزدهای واژگانی با همپوشانی واج شناختی کلمه – ابتدا (رقبای همگروهی) به شدت برای تشخیص رقابت میکنند (مثلاً در شنیدن دنباله گفتاری /k æ p.. / همه کلماتی که با این صداها شروع میشوند، مانند کاپیتان و اسیر). به صورت موازی فعال شد، Marslen-Wilson، 1987، Marslen-Wilson and Welsh، 1978). با این حال، مدلهای نگاشت پیوسته تشخیص کلمه گفتاری (به عنوان مثال، TRACE، McClelland و Elman، 1986؛ و Shortlist، Norris، 1994) فرض میکنند که دسترسی واژگانی پیوسته است و بنابراین پیشبینی میکند که کلمات قافیهای (مثلاً ” Beaker ” / ” Speaker “) همچنین باید حداقل ضعیف فعال شود.
شواهدی برای چنین اثرات رقیب قافیه از مطالعات زمان واکنش قطعی نیست (Connine و همکاران، 1993، Marslen-Wilson و Zwitserlood، 1989، Shillcock، 1990). در مطالعه دنیای بصری خود، آلوپنا و همکاران. از شرکتکنندگان خواسته بود که «لیوان را بردارید. اکنون آن را در زمینه نمایش بصری اشیاء از جمله، بهعنوان مثال، یک فنجان، یک سوسک (رقیب همپوشانی شروع واجی)، یک گوینده (رقیب قافیه واجی)؛ و یک کالسکه (یک حواس پرتی نامرتبط) قرار دهید. آنها دریافتند که احتمال تثبیت هم به لیوان و هم در سوسک با شنیده شدن کلمه “بیکور” افزایش مییابد. همانطور که اطلاعات آکوستیک از “لیوان” شروع به عدم تطابق واج شناختی با “سوسک” کرد، احتمال نگاه به سوسک کاهش مییابد، زیرا احتمال نگاه به لیوان همچنان افزایش مییابد. با باز شدن انتهای کلمه “بشار” ظاهر به ” Speaker ” شروع به افزایش کرد. بنابراین، رقبای شروع کننده هدف زودتر (و شدیدتر) برای جلب توجه آشکار نسبت به رقبای قافیه رقابت کردند (همچنین رجوع کنید به Magnuson، Tanenhaus، Aslin و Dahan، 2003، برای نتایج مشابه با استفاده از واژگان مصنوعی).
این دادهها تأیید میکنند که اطلاعات صوتی در ابتدای کلمات گفتاری مهمتر از اطلاعات آکوستیک بعداً در کلمه هستند، اما همچنین نشان میدهند که همپوشانی واجشناختی شروع – تطابق با این حال انتخاب واژگانی را محدود میکند، همانطور که توسط TRACE پیشبینی شد (McClelland & Elman، 1986)؛ و فهرست نهایی B (نوریس و مک کوئین، 2008).
Magnuson، Dixon، Tanenhaus و Aslin (2007) اثرات فراوانی کلمه (همچنین رجوع کنید به Dahan، Magnuson؛ و Tanenhaus، 2001)، تراکم گروهی (یعنی تعداد کلماتی که در شروع کلمه با هم تداخل دارند) و تراکم همسایگی (یعنی تعداد کلماتی که تنها با یک واج در هر موقعیت کلمه با هدف مطابقت ندارند) در تثبیت شی هدف. آنها اشیاء هدف را با سه حواس پرت کننده نامرتبط نمایش دادند. رقبا نمایش داده نشدند. اهداف فرکانس بالا بیشتر و زودتر از اهداف فرکانس پایین تثبیت شدند.
اهداف با چگالی کوهورت بالا کمتر و دیرتر از اهداف با چگالی کوهورت کم تثبیت شدند. یک اثر متقاطع برای تراکم همسایگی وجود داشت: در اوایل کلمه، اهداف با تراکم همسایگی بالا بیشتر از اهداف با تراکم همسایگی کم ثابت میشدند، اما پس از جبران کلمه این اثر معکوس شد. این دادهها نشان میدهند که همگروههای همسایگی و همگروههای شناسایی ثابت نیستند، اما مجموعههای رقیب بهطور پویا در طول زمان تغییر میکنند.
برخی از مطالعات جهان بصری نحوه برخورد شنوندگان با تأثیرات گفتار متصل و فرآیندهای گفتار غیررسمی را بررسی کردهاند. گفتار مکالمه شامل کاهشهای واجشناختی بسیاری است (یعنی کلمات با واجهای کمتر یا متفاوت نسبت به شکل متعارف خود تلفظ میشوند). میترر و مک کوئین (2009) نمایشهای بصری را ارائه کردند که حاوی کلمات هلندی چاپ شده ” tas ” (کیف) یا “طعم” (لمس) و دو حواس پرتی بود. هنگامی که جمله هلندی (“… tas “) با کلمه هلندی ” boven ” (بالا) ادامه مییافت، بیشتر از زمانی که با کلمه ” naast ” ادامه مییافت، شنوندگان کلمات پایانی /t/- را تثبیت میکردند (مثلاً tast). (بعد). میترر و مک کوئین (2009) استدلال کردند که این رفتار تولید گفتار هلندی را منعکس میکند زیرا کلمه نهایی /t/ در هلندی معمولاً قبل از /b/ بیشتر از قبل از /n/ کاهش مییابد. آنها به این نتیجه رسیدند که شنوندگان از دانش احتمالی در مورد تأثیر دنبال کردن زمینه پیش از واژگانی برای حل ابهامات واژگانی ناشی از فرآیندهای گفتار مداوم استفاده میکنند.
بروور (2010) از نسخه چاپی این پارادایم استفاده کرد تا بررسی کند که آیا تشخیص کلمه گفتاری در گفتار محاورهای معمولی (شامل کاهشهای گفتاری زیاد) با گفتار آزمایشگاهی دقیق بیان شده (همانطور که تقریباً در همه آزمایشهای روانزبانی – از جمله دنیای بصری – استفاده میشود) متفاوت است یا خیر. بروور تشخیص اشکال متعارف کلمات محتوای با فرکانس متوسط تا بالا را در نمایشگرهای چهار کلمه که یکی از آنها هدف بود مقایسه کرد. بروور رقبای فرم متعارف (مثلاً “همراه” برای “رایانه” که از نظر واج شناختی در شروع با شکل متعارف بیشتر تداخل داشت تا با شکل کاهش یافته کلمه گفتاری) و رقبای فرم کاهش یافته (مثلا “دانش آموز” برای ” puter “) ایجاد کرد. ، که از نظر واج شناختی در ابتدا با شکل کاهش یافته بیشتر همپوشانی داشت تا با شکل متعارف کلمه گفتاری (“رایانه”).
شنوندگان به طور قابل توجهی توجه آشکارتری را به رقیب فرم متعارف نسبت به رقیب فرم کاهش یافته در شرایط گفتاری آزمایشگاهی و شرایط گفتاری گاه به گاه زمانی که جملات گفتاری حاوی هیچ کاهش گفتاری نبود، معطوف کردند. با این حال، زمانی که سخنرانی حاوی کاهش بود، تفاوتی بین تثبیت شنوندگان به فرم متعارف و رقبای فرم کاهش یافته وجود نداشت. بروور به این نتیجه رسید که در طول گفتار غیررسمی، که شامل مقدار زیادی از اشکال کلمات کاهش یافته است، شنوندگان نسبت به عدم تطابق صوتی بین ورودی و فرم متعارف نسبت به گفتار رسمیتر، تحمل بیشتری دارند. بنابراین این دادهها نشان میدهند که تنوع ذاتی گفتار (به عنوان مثال، قابلیت اطمینان و کیفیت کلی ورودی آوایی) میتواند بر رقابت واجشناختی تأثیر بگذارد.
چندین مطالعه دیگر پردازش جزئیات آوایی را بررسی کردهاند. راینیش، جسی و مک کوئین (2010) دریافتند که شرکت کنندگان در دنیای بصری میتوانند از اطلاعات استرس واژگانی برای هدایت نگاه چشم استفاده کنند. آنها دریافتند که وقتی شرکت کنندگان کلماتی را با استرس اولیه میشنیدند (مثلاً “اختاپوس”) تثبیت کلمات هدف چاپ شده با تاکید بر هجای اول (مثلاً اختاپوس) بیشتر از تثبیت روی رقبای با استرس متفاوت بود (مثلاً اکتبر، با استرس در دوم). هجا) قبل از اینکه اطلاعات قسمتی بتواند کلمات را ابهام کند. نویسندگان به این نتیجه رسیدند که شنوندگان کلمات را با استفاده فوری از تمام اطلاعات مرتبط در سیگنال صوتی تشخیص میدهند.
مک موری و همکارانش از الگوی دنیای بصری استفاده کردند تا نشان دهند که تشخیص کلمات گفتاری حساسیت درجهبندی شدهای را نسبت به زمان شروع صدای درون دستهای نشان میدهد (نشان قوی برای تشخیص صداهای صوتی مانند /b/ از صداهای بیصدا مانند /p/؛ مک موری و همکاران). ، 2002، مک موری و همکاران، 2008، مک موری و همکاران، 2009). سالوردا، داهان و مک کوئین (2003) مدت زمان یک سکانس آکوستیک مبهم را تغییر دادند (همچنین به Shatzman & McQueen، 2006 مراجعه کنید). در یکی از نمایشهای خود، آنها تصاویری از یک تکه ژامبون، یک همستر و دو حواس پرتی نامرتبط ارائه کردند. آنها مشاهده کردند که شرکت کنندگان زمانی که اولین هجای کلمه مورد نظر (یعنی “همستر”) از ضبط کلمه تک هجای ” hamster ” ناشی میشود، بیشتر به تصویر ژامبون نگاه میکنند تا زمانی که از یک ضبط معمولی متفاوت از ” hamster ” نشات میگیرد. . سالوردا و همکاران دریافتند که این تأثیر به این دلیل است که دنباله آکوستیک ” ham ” در کلمه تک هجای ” ham ” طولانیتر از ” hamster ” است. آنها به این نتیجه رسیدند که شنوندگان میتوانند از جزئیات آوایی ظریف مانند طولانی شدن قسمتی در هنگام تشخیص کلمه گفتاری استفاده کنند.
این نتایج نشان دهنده حساسیت شنوندگان به جزئیات آوایی در جملاتی است که میشنوند. با این حال، مشخص نیست که تا چه حد تأثیرات توسط فعال سازی قبلی نامزدهای واژگانی از مشاهده اشیاء (به عنوان مثال، از مشاهده ژامبون و همستر در مطالعه سالوردا و همکاران) ایجاد شده است. شاید بتوان از نشانههای ظریف در سیگنال گفتار در مطالعات جهان بصری به دلیل چنین پیش فعال سازی استفاده کرد، اما در غیاب پشتیبانی بصری قوی، احتمال استفاده از این نشانهها بسیار کمتر است (اما رجوع کنید به Tanenhaus, Magnuson, Dahan, & Chambers, 2000، برای یک دیدگاه متفاوت).
وضعیت احتمالاً برای نشانههای قوی متفاوت است، مانند نشانههایی که شروع یک کلمه را نشان میدهند، که احتمالاً حتی در غیاب پرایمینگ از تصاویر مهم هستند. مطالعه آلوپنا و همکاران. (1998) این نکته را نشان میدهد. بر خلاف اثرات همپوشانی شروع قوی، اثرات رقیب قافیه (بشق / بلندگو) کوچک هستند و معمولاً فقط از نظر آماری قابل توجه هستند (همچنین نگاه کنید به آلوپنا و همکاران، 1998، Huettig and McQueen، 2009، McQueen and Viebahn، 2007). بنابراین مشخص نیست که آیا رقبای قافیه نقش مهمی در پردازش گفتار در موقعیتهای رایجتری دارند که در آنها هیچ پیش فعال سازی کلمات نامزد وجود ندارد یا خیر. همانطور که قبلاً ذکر شد، قبل از نمایش اثرات رقیب قافیه در تشخیص کلمه گفتاری توسط آلوپنا و همکاران. (1998)، نشان دادن چنین اثراتی با استفاده از روشهایی مانند پرایمینگ متقاطع یا شنوایی – شنیداری دشوار بود. کانین و همکاران (1993) و آندروسکی، بلومشتاین و برتون (1994) متوجه شدند که پرایمینگ ضعیف اقلام ناسازگار آغازی تنها زمانی که اول و هدف بیش از یک یا دو ویژگی آوایی با هم تفاوت نداشته باشند.
آلوپنا و همکاران در مقابل، (1998)، رقیب قافیه را مورد توجه قرار داد، حتی اگر بیش از دو ویژگی با کلمه هدف تفاوت داشت. این امکان وجود دارد که روش دنیای بصری به دلیل فعال شدن از قبل رقبای قافیه از طریق پیش نمایش اشیاء بصری، برای تشخیص افکتهای رقیب قافیه حساستر باشد.
موقعیتهایی وجود دارد که در آن نشانههای ضعیف میتوانند اهمیت ویژهای پیدا کنند، برای مثال زمانی که در شرایط شنیداری پر سر و صدا، نشانههای شروع قوی کمتر قابل اعتماد میشوند. Huettig و McQueen (2009) اخیراً نشان دادند که چگونه نویز محیطی میتواند تأثیر همپوشانی قافیه را در هنگام تشخیص کلمات گفتاری افزایش دهد. آنها نتایج به دست آمده توسط آلوپنا و همکاران را تکرار کردند. با شرکت کنندگانی که رقبای شروع همپوشانی را بیشتر از رقبای همپوشانی قافیه تثبیت میکردند، اما قدرت این تمایل با کیفیت گفتار متفاوت بود. نسبت به خط مبنا با جملات بدون نویز، شرکت کنندگان کمتر به همپوشانی شروع و بیشتر به تصاویر همپوشانی قافیه نگاه میکردند که برخی از واجها در جملات (اما نه در کلمات انتقادی) با نویز رادیویی AM جایگزین شدند. موقعیت نویز در کلمات اطراف (کلمه – ابتدای یا کلمه – واسطه) تاثیری نداشت. بنابراین سروصدا در جاهای دیگر جملات ظاهراً شواهدی را درباره کلمه انتقادی کمتر قابل اعتماد نشان میدهد: شنوندگان کمتر مطمئن میشوند که نام شروع – همپوشانی را شنیدهاند و نام قافیه – همپوشانی را نشنیدهاند. بنابراین، همان اطلاعات صوتی اثرات متفاوتی بر رقابت واجشناختی در حین تشخیص گفتاری دارد زیرا احتمال اعوجاج در محیط تغییر میکند.
در مجموع، تحقیقات دنیای بصری در مورد مطالعه پردازش زبان واجشناسی و آوایی نشان داده است که نشانههای آوایی ظریف میتوانند فعالسازی واژگانی را تعدیل کنند. با این حال، این امکان وجود دارد که اثرات گزارش شده در مطالعات حداقل تا حدی ناشی از پیش فعال سازی نامزدهای واژگانی از مشاهده نمایش محرک باشد. این امر به ویژه در نسخه کلمه چاپی پارادایم محتمل است زیرا کلمات چاپ شده به آسانی اشکال واج شناختی مربوطه را فعال میکنند (ون اوردن، جانستون؛ و هیل، 1988؛ همچنین به فراست، 1998 مراجعه کنید). با در نظر گرفتن رقبا، ممکن است توجه به نشانههای خاص در سیگنال گفتار که خیلی زود بین آیتمهای مختلف در نمایشگر ابهام میکنند، آسانتر شود. میتوان تصور کرد که در سایر شرایط گوش دادن و موقعیتهای مکالمه، نشانههای ظریف نقش ناچیزی ایفا میکنند.
4.2. تشخیص کلمه دو زبانه
یک مسئله مهم در تحقیقات دوزبانگی این است که آیا دسترسی واژگانی در دوزبانهها به زبان خاص است (یعنی محدود به زبان مورد نظر) یا به طور متناوب هر دو زبان فعال هستند و ممکن است بر عملکرد تأثیر بگذارند. یک مطالعه اساسی در مورد این موضوع توسط اسپایوی و ماریان (1999) انجام شد. آنها به دوزبانه روسی – انگلیسی جملات روسی مانند «Poloji marku nije krestika» ( «مهر را زیر صلیب بگذارید» ارائه کردند. چهار شی در نمایش بصری وجود داشت: تمبر، یک نشانگر و دو حواس پرتی نامرتبط. از نظر انتقادی، شکل واجشناختی انگلیسی «مارکر» از نظر واجشناسی شبیه به کلمه روسی «مارکو» (مهر) است. با شنیدن کلمه روسی “مارکو”، شرکت کنندگان بیشتر به تصویر یک نشانگر نگاه میکردند تا به اشیاء حواس پرت کننده، اگرچه کلمه روسی نشانگر هیچ شباهتی واج شناختی با کلمه گفتاری ندارد. اسپایوی و ماریان (1999) به این نتیجه رسیدند که شنوندگان دوزبانه نمیتوانند زبان دیگر خود را در شرایط تک زبانه غیرفعال کنند (همچنین نگاه کنید به ماریان و اسپایوی، 2003a، ماریان و اسپایوی، 2003b).
با این حال، مطالعات بعدی دنیای بصری نشان میدهد که این نتیجه ممکن است خیلی قوی باشد؛ وبر و کاتلر (2004) نتوانستند مدرکی پیدا کنند که نشان دهد شنوندگان هلندی هنگام گوش دادن به جملات هلندی کلمات انگلیسی را فعال میکنند (یعنی هنگام شنیدن کلمه هلندی ” deksel “، درپوش، آنها تصویر یک میز را بیشتر از تصاویر حواس پرتی نامرتبط ثابت نکردند. . لازم به ذکر است که نمونههای مورد استفاده در دو مطالعه کاملاً متفاوت بودند. دوزبانه روسی – انگلیسی در مطالعه اسپایوی و ماریان (1999) در نوجوانی به ایالات متحده مهاجرت کرده بودند، در یکی از دانشگاههای سطح بالای ایالات متحده تحصیل میکردند و کاملاً در زندگی روزمره خود با زبان انگلیسی غرق شده بودند. در مقابل، دوزبانه هلندی – انگلیسی در مطالعه وبر و کاتلر (2004) در هلند زندگی میکردند و بیشتر از هلندی در زندگی روزمره استفاده میکردند.
وبر و کاتلر (2004) همچنین جملات گفتاری انگلیسی را به شنوندگان هلندی و شنوندگان بومی بریتانیایی – انگلیسی ارائه کردند. از شرکتکنندگان خواسته شد تا روی آیتمهای موجود در صفحهای که مثلاً یک پاندا و یک مداد در آن وجود دارد، کلیک کنند. توجه داشته باشید که هلندی زبانان در تشخیص کلمات انگلیسی حاوی / æ / از کلمات حاوی / ε / مشکل دارند؛ وبر و کاتل دریافت که شنوندگان هلندی که «پاندا» میشنوند، بیشتر به مداد نگاه میکنند تا حواس پرت کنندههای نامرتبط. شنوندگان انگلیسی این کار را انجام ندادند. جالب اینجاست که وقتی از شنوندگان هلندی خواسته شد “روی مداد کلیک کنید”، تثبیت بیشتری نسبت به پاندا نشان ندادند (یعنی عملکرد آنها شبیه به شنوندگان انگلیسی بومی بود)؛ وبر و کاتلر پیشنهاد کردند که اثر تداخل نامتقارن در مطالعه آنها به این دلیل به وجود آمد که در سطح پردازش آوایی یکی از دستههای L2 غالب است (به عنوان مثال / ε /). به نظر میرسد که تسلط با نزدیکی صوتی – آوایی به نزدیکترین دسته L1 تعیین میشود (کاتلر؛ وبر؛ و اوتاک، 2006). بنابراین در سطح پردازش واژگانی، نمایشهای حاوی این دسته غالب بیشتر از بازنماییهای حاوی دسته غیر غالب (یعنی / æ /، که در هلندی وجود ندارد) با ورودی آوایی ارتباط برقرار میکنند.
دادههای به دست آمده توسط جو و لوس (2004) تأثیر اطلاعات آوایی / آواشناسی را برای شنوندگان دوزبانه روشن میکند. آنها نتوانستند یافتههای اسپایوی و ماریان (1999) را با استفاده از اهداف اسپانیایی بدون تغییر تکرار کنند. جو و لوس (2004) تنها زمانی تداخل را مشاهده کردند که کلمات هدف اسپانیایی حاوی زمان شروع صدای مناسب انگلیسی بودند. جو و لوس (2004) به این نتیجه رسیدند که اطلاعات آکوستیک – آوایی دقیق و تطابق دقیق بین ورودی صوتی و نمایشهای ذخیرهشده برای فعالسازی موازی دو زبان حیاتی است (همچنین رجوع کنید به Pallier et al., 2001, Li, 1996, Grosjean, 1988. ).
Canseco-Gonzalez و همکاران. (2010) از دوزبانه انگلیسی – اسپانیایی خواسته شد دستورالعملهایی مانند “روی لوبیاها کلیک کنید” را دنبال کنند. رقبای متقابل زبانی واج آغازی مشابهی در اسپانیایی داشتند (مانند «تعصب» و سبیل). Canseco-Gonzalez و همکاران. (2010) اثر متقابل زبانی ضعیفی را یافت که با سن فراگیری زبان اسپانیایی تعدیل شد (با دوزبانههای اولیه شواهد کمی از فعال سازی متقابل زبانی نشان دادند). یافتههای آنها نشان میدهد که میزان فعالسازی متقابل زبانی تحت تأثیر سن اکتساب هر یک از زبانها است.
در مجموع، به نظر میرسد که زمینه بصری، اطلاعات آکوستیک دقیق، سن کسب، مهارت زبان؛ و نحوه پردازش همگی تعیین میکنند که دوزبانهها تا چه اندازه در موقعیت تکزبانه بازنمایی زبان دیگر خود را فعال میکنند (نگاه کنید به شماره ویژه Acta. Psychologica، جلد 128 (3)، 2008، برای بحث دقیق در مورد تحقیقات دو زبانه فعلی).
4.3. تأثیر بافت معنایی و نحوی در تشخیص واژه گفتاری
موضوع مدولاریت (در بخش 3 در مورد پردازش جملات مورد بحث قرار گرفت) همچنین بر بسیاری از کارهای روانزبانی در مورد پردازش واژگانی (یعنی کلمه) تأثیر گذاشته است. بسیاری از مطالعات کلاسیک با استفاده از انواع پارادایمها نشان میدهند که معانی متعددی از کلمات مبهم فعال میشوند، حتی زمانی که محدودیتهای معنایی یا نحوی باید یک سوگیری قوی نسبت به یکی از معانی ایجاد کند (مانند Onifer و Swinney، 1981، Seidenberg و همکاران، 1982، Tanenhaus؛ و همکاران، 1979؛ ویتنی و همکاران، 1985). این مطالعات نشان میدهد که حداقل اولویت اولیه از پایین به بالا زمانی که شنوندگان سیگنال صوتی را درک میکنند وجود دارد (مرس کنید به Marslen-Wilson، 1987، Marslen-Wilson، 1990). مطالعات دیگر نشان دادهاند که بافت میتواند تأثیرات اولیهای بر فعالسازی معانی کلمات داشته باشد (موس و مارسلن ویلسون، 1993، تابوسی، 1988، تابوسی و همکاران، 1987؛ ون برکوم و همکاران، 2003).
در یک مطالعه دنیای بصری، Dahan و Tanenhaus (2004) به شرکت کنندگان هلندی خود نمایشهای بصری چهار شیء ارائه کردند: یک شی هدف (به عنوان مثال، یک بز، “بوک” هلندی)، یک رقیب واج شناختی (به عنوان مثال، یک استخوان، یک “ربات هلندی” ”)، یک رقیب معنایی (به عنوان مثال عنکبوت، هلندی “چرخش”) و یک حواس پرتی نامرتبط. دو شرط داشت. در شرایط فعل محدودکننده، یک فعل محدودکننده (مثلاً صعود) قبل از اسم مهم ظاهر میشود (مثلاً، «Nog nooit klom een bok zo hoog» – قبلاً هرگز از یک بز تا این حد بالا نرفتم). رقیب معنایی (مثلاً عنکبوت، هلندی ” spin “) بهعنوان یک موضوع معقول فعل اما از نظر واج شناختی متفاوت از هدف (بز، ” bok “) انتخاب شد. در حالت خنثی، فعل مقید از اسم انتقادی پیروی میکند (مثلاً، ” Nog nooit is een bok zo hoog geklommen ” – تا به حال هرگز بزی تا این حد بالا نیامده است). در هر دو شرایط یک اثر رقیب معنایی کوچک وجود داشت (یعنی نگاههای بیشتری به عنکبوت نسبت به حواس پرتی نامرتبط). در شرایط خنثی، شرکتکنندگان بیشتر به بز (یعنی بوک) و استخوان (یعنی ربات) نگاه میکردند تا حواسپرتیهای نامرتبط از نظر واجشناختی که کلمه هدف شنیده میشد. این نتیجه نشاندهنده اثر رقابت استاندارد شکلهای واجشناختی است که در شروع کلمه همپوشانی دارند (به عنوان مثال، آلوپنا و همکاران، 1998). در مقابل، در شرایط فعل محدودکننده، شرکتکنندگان در شنیدن «بوک» بیشتر به ربات (استخوان) نگاه نمیکردند تا حواسپرتیهای نامربوط، که نشاندهنده تأثیر فوری بافت بر تشخیص کلمه است.
عدم وجود نگاه به رقیب مرتبط از نظر واج شناختی در شرایط محدود کننده لزوماً به این معنی نیست که کلمه فعال نشد شرکتکنندگان در پارادایم دنیای بصری سعی میکنند از گفتار و ورودی بصری برای تفسیر موقعیت مورد نظر معنا پیدا کنند. در مطالعه Dahan و Tanenhaus (2004)، شرکت کنندگان با فعل مغرضانه “بالا رفتن” مواجه شدند و پیش بینی کردند که bok (بز) مرجع مورد نظر است (ر. ک. Altmann & Kamide, 1999) همانطور که از افزایش تثبیت به bok (بز) حتی مشهود است. قبل از اینکه اطلاعات صوتی از اسم مهم در دسترس قرار گیرد. به منظور جداسازی اثرات پیش بینی مبتنی بر فعل از اثراتی که منعکس کننده ادغام فوری اطلاعات آوایی / آواشناسی از کلمه مقصد با بافت معنایی هستند، داهان و تاننهاس (2004) به طور جداگانه 10 مورد را در شرایط فعل محدود تجزیه و تحلیل کردند.
اثر پیش بینی نسبت به هدف (یعنی این موارد یک اثر پیش بینی را نسبت به رقیب معنایی نشان دادند). تجزیه و تحلیل این 10 مورد، الگوی مشابهی را با نتایج کلی نشان داد: هیچ تغییری به سمت رقبای واجشناختی وجود نداشت (یعنی وقتی فعل «bok»، بز را متمایل میکرد، بیشتر به «ربات»، استخوان نگاه نمیکرد تا حواسپرتی غیرمرتبط). Dahan و Tanenhaus استدلال کردند که نتایج آنها “مدلهایی را که در آنها نگاشت از ورودی به معنا مستمر است نسبت به مدلهایی که در آنها اثرات متنی به دنبال دسترسی به یک مجموعه رقیب مبتنی بر فرم اولیه است” (ص. 498؛ همچنین رجوع کنید به Magnuson, Tanenhaus, & Aslin). ، 2008، برای تفسیر مشابهی از یک اثر صفر).
با این حال، نتایج برای تفسیر متفاوتی باز است. نمایشهای واجشناختی ربات (استخوان) ممکن است به همان شدتی توسط سیگنال صوتی فعال شوند که در حالت خنثی، زیرا نگاه چشم معیاری برای توجه آشکار است و نه بازنماییهای زبانی زیربنایی. نمیتوان رد کرد که توجه آشکار نتیجه فرآیندی را منعکس میکند که زمینه را با دسترسی واژگانی اولیه (مثلاً مبتنی بر فرم) ادغام میکند (یعنی در مراحل اولیه در طول پردازش هدف، همه کلمات مرتبط، صرف نظر از تناسب متنی آنها. ، فعال شدند).
4.4. نگاشت بازنمایی های مشتق از زبان و برگرفته از چشم انداز
خط متفاوتی از تحقیقات بررسی میکند که چگونه بازنماییهایی که با شنیدن کلمات گفتاری به دست میآیند با اطلاعات مفهومی و ادراکی که از مشاهده صحنههای بصری یا نمایش اشیا به دست میآیند یکپارچه میشوند. مسائل نظری اصلی این خط از تحقیقات عبارت است از درک (1) اینکه آیا حرکات چشم با واسطه زبان به دلیل شباهت بین اهداف و رقبا انجام میشود یا دانش طبقه بندی شده همه یا هیچ، (2) اینکه آیا آنها با واسطه ویژگیهای ادراکی هستند یا نه. دانش ذخیره شده در مورد اشیاء تصویر شده، (iii) اینکه آیا برخی از انواع دانش (به عنوان مثال، اطلاعات عملکردی) بر سایرین اولویت دارند یا خیر؛ و (IV) چگونه این فرآیندهای نقشه برداری تحت تأثیر کنترل شناختی و تقاضاهای موقعیتی قرار میگیرند.
کوپر (1974)، در مطالعه مهم دنیای بصری خود، مشاهده کرد که شرکتکنندگانی که «آفریقا» را میشنیدند، بیشتر به عکسهایی که شیر، گورخر یا مار را نشان میدهند ثابت میکردند تا اشیاء غیرمرتبط معنایی. بنابراین، حرکات چشم فعال سازی آنلاین معناشناسی کلمه را از ورودی گفتار نشان داد. کوپر (1974) ماهیت اثرات معنایی را که مشاهده کرد به طور سیستماتیک بررسی نکرد. بهعنوان مثال، کلمات “آفریقا” و “شیر” به طور تداعی مرتبط هستند و بنابراین مشخص نیست که آیا تأثیرات معنایی کوپر ناشی از شباهت معنایی است یا صرفاً ارتباط.
با پیگیری کار کوپر (1974)، Huettig و Altmann (2005) دریافتند که شرکت کنندگان توجه آشکار را به سمت یک شی به تصویر کشیده شده (مانند ترومپت) هنگامی که یک کلمه هدف از نظر معنایی مرتبط است اما از نظر تداعی مرتبط نیست (به عنوان مثال، “پیانو”) معطوف میکنند. شنیده شد (همچنین رجوع کنید به Yee and Sedivy, 2006, Dunabeitia et al., 2009). به طور مهمی، احتمال تثبیت رقیب معنایی به طور قابل توجهی با شباهت معنایی بین کلمه گفتاری (مثلاً “پیانو”) و شی رقیب (مانند ترومپت) که از هنجارهای ویژگی معنایی مشتق شده است، همبستگی دارد (کری و مکری، 2003). این دادهها نشان میدهد که افزایش توجه معطوف به موارد مرتبط معنایی (نسبت به اشیاء حواس پرت کننده) تابعی از میزان همپوشانی معنایی است.
Huettig، Quinlan، McDonald and Altmann (2006) (همچنین به Yee, Overton & Thompson-Schill, 2009 مراجعه کنید) شواهد بیشتری برای این نتیجه گیری ارائه کردند. آنها دریافتند که چندین معیار معنایی کلمه مبتنی بر پیکره (تحلیل معنایی پنهان، لاندوئر و دومایس، 1997؛ شباهت متنی، مک دونالد، 2000) هر کدام به خوبی با رفتار تثبیت همبستگی دارند. این دادهها شواهد محکمی ارائه میدهند که حرکات چشم با واسطه زبان به دلیل شباهت معنایی بین کلمه گفتاری و شیء بصری به جای دانش طبقهبندی همه یا هیچ، هدایت میشوند.
با توجه به اثرات مشاهدهشده همپوشانی معنایی / مفهومی، این سؤال مطرح میشود که آیا همپوشانی ادراکی بین یک هدف و یک عامل حواسپرتی بر حرکات چشم با واسطه زبان تأثیر میگذارد؟ چندین مطالعه نشان دادهاند که نگاه چشم به اشیایی هدایت میشود که از نظر بصری (به عنوان مثال، از نظر شکل) با t مرتبط هستند.
آرجتها اما از نظر معنایی نامرتبط هستند (Dahan and Tanenhaus, 2005, Huettig and Altmann, 2004, Huettig and Altmann, 2007). برای مثال، هنگام شنیدن «مار»، شرکتکنندگان توجه آشکار را به تصویری از یک کابل معطوف کردند (کابل و مار شکل کلی مشابهی دارند)، حتی اگر قبل از شنیدن کلمه مورد نظر، صفحه نمایش چهار شی را برای حدوداً 5 ثانیه مشاهده کرده بودند. زمان کافی برای تشخیص اشیاء برای آنچه که هستند بود (Huettig & Altmann, 2007). Dahan و Tanenhaus (2005) این نتایج را به گونهای تفسیر کردند که نشان میدهد احتمال تثبیت جسم بصری منعکس کننده تطابق بین دانش فرم بصری ذخیره شده، که از کلمه گفتاری قابل دسترسی است؛ و ویژگیهای بصری قابل دسترسی از نمایش بصری (“نمایش ساختاری درشت” است. مرتبط با مکان هر شی” (Dahan & Tanenhaus، 2005، ص 457) در یک مطالعه مرتبط، Huettig و Altmann (2004) دریافتند که حرکات چشم در پارادایم دنیای بصری میتواند توسط روابط رنگی واسطه شود: شرکت کنندگان توجه آشکار را به تصویری از یک توت فرنگی هنگامی که آنها “لب” را شنیدند؛ توت فرنگی و لبها رنگ معمولی مشابهی دارند.
سؤال جالبی که توسط این یافتهها مطرح میشود این است که آیا حرکات چشم شرکتکنندگان تحت تأثیر ورودی بصری (یعنی ویژگیهای ادراکی) یا دانش ذخیرهشده در مورد اشیاء به تصویر کشیده شده است. شکل یک جسم، بهعنوان مثال شکل بلند و نازک یک مار، میتواند درک شود (اطلاعات ادراکی) اما همچنین شناخته شده است (اطلاعات مفهومی). بنابراین، مشخص نیست که آیا تغییر شکل محور در توجه آشکار ناشی از دانش ذخیره شده (مفهومی) از شکل اشیاء نمایش داده شده است یا به دلیل شکل درک شده اشیاء در نمایش بصری (همچنین به Yee, Huffstetler, & تامپسون – شیل، 2009). به طور مشابه، مشخص نیست که آیا اثر رنگ مشروط به دانش ذخیره شده در مورد رنگ معمولی شیء نمایش داده شده است یا اینکه توجه به واسطه زبان نیز میتواند مشروط به رنگ سطح درک شده اشیاء بصری باشد.
رنگ یک ویژگی شی است که امکان بررسی این سؤال را فراهم میکند زیرا ویژگیهای مفهومی (دانش رنگ ذخیره شده در مورد یک شی) و ویژگیهای ادراکی (رنگ درک شده اما غیر تشخیصی یک شی، یعنی رنگ سطح آن) قابل تفکیک هستند. Huettig و Altmann (2011) به شرکت کنندگان کلمات هدف گفتاری ارائه کردند که مفاهیم آنها با یک رنگ تشخیصی مرتبط است (به عنوان مثال، “اسفناج”، اسفناج معمولاً سبز است) در حالی که حرکات چشم آنها به (1) اشیاء مرتبط با یک رنگ تشخیصی نظارت میشد اما ارائه شد. در سیاه و سفید (به عنوان مثال، یک خط سیاه و سفید از یک قورباغه)، (2) اشیاء مرتبط با یک رنگ تشخیصی اما در یک رنگ مناسب اما غیر معمول ارائه شده است (به عنوان مثال، یک عکس رنگی از یک قورباغه زرد) و (iii) اشیایی که با رنگ تشخیصی مرتبط نیستند اما با رنگ تشخیصی مفهوم هدف ارائه میشوند (به عنوان مثال، یک بلوز سبز). Huettig و Altmann هیچ تأثیری از دانش رنگ اشیای ذخیره شده در هنگام ارائه نقاشیهای سیاه و سفید یا عکسهای سیاه و سفید پیدا نکردند.
هنگامی که عکسهای رنگی که شی مورد نظر (مثلا قورباغه) را با رنگی غیر معمول اما مناسب (مثلا قورباغه زرد) نشان میدادند، یک اثر ضعیف از دانش رنگ شی ذخیرهشده مشاهده شد. این نشان میدهد که شرکتکنندگان با شنیدن «اسفناج» اطلاعات رنگ اولیه (یعنی سبز) را بازیابی کردند، که با اطلاعات رنگ اولیه ذخیرهشدهای که از دیدن قورباغه زرد بازیابی کردند (یعنی قورباغهها معمولاً سبز هستند) مطابقت داشت. با این حال، اثر حاشیهای بود و نسبتاً دیر رخ میداد (بیش از یک ثانیه پس از در دسترس قرار گرفتن اطلاعات از کلمه هدف صوتی). این نتایج نشان میدهد که رنگ شی ذخیرهشده میتواند بر حرکات چشم با واسطه زبان تأثیر بگذارد، اما به نظر میرسد این تأثیر کوچک است.
این یافته که چنین تأثیری با محرکهای سیاه و سفید وجود ندارد، نشان میدهد که عدم وجود رنگ در محرکها باعث سوگیری توجهی میشود که منجر به اثر پوچ خواص رنگ میشود. در ادبیات جستجوی بصری استدلال شده است که تأثیرات یک ویژگی بصری خاص ممکن است بسته به تنظیم کنترل توجه اتخاذ شده توسط شرکت کننده، کم و بیش باعث جلب توجه شود (Folk et al., 1992, Folk et al., 1993; همچنین نگاه کنید به پرت و هومل، 2003). به طور مشابه، با توجه به نظریات مبتنی بر بعد توجه انتخابی (به عنوان مثال، آلپورت، 1971، مولر و همکاران، 1995)، اطلاعات از بالا به پایین ویژگیهای تعیین کننده هدف بر مراحل مطالعه پردازش زبان ویژگیها تأثیر میگذارد (Found and M ü ller، 1996، Treisman). ، 1988؛ همچنین نگاه کنید به Kumada، 2001). بنابراین ممکن است که محرکهای سیاه و سفید توجه به بعد رنگ را کاهش دهند زیرا در زمینه خاص ارتباط کمی داشتند.
Huettig و Altmann (2011) همچنین تأثیر رنگ سطح درک شده را در غیاب دانش رنگ ذخیره شده بررسی کردند. شرکت کنندگان با شنیدن کلمات هدف که با یک رنگ اولیه، مانند “نخودی” مرتبط بودند، به سمت خود نگاه کردند یک تصویر به آن رنگ نمایش داده میشود، حتی اگر مرجع تصویر (به عنوان مثال، یک بلوز سبز) خود با آن رنگ مرتبط نباشد. با دسترسی به اطلاعات رنگ اولیه مرجع هدف، شرکت کنندگان بلافاصله توجه آشکار را به هر چیزی با همان رنگ سطح معطوف کردند. این دادهها نمایش واضحی از یک اثر رنگ سطحی خالص هستند. به طور کلی، این آزمایشها نشان میدهند که تغییرات با واسطه رنگ در توجه آشکار عمدتاً به دلیل ویژگیهای سطح درک شده اشیاء بصری است نه دانش ذخیره شده در مورد رنگ معمولی اشیاء.
با این حال، ممکن است که جلوههای رنگی با برچسبهای رنگی ذخیره شده (مثلاً برچسب “سبز” که با شنیدن کلمات گفته شده قابل دسترسی است) واسطه شوند. هنگامی که شرکت کنندگان کلمه گفتاری “قورباغه” را میشنوند، ممکن است به طور خودکار به کلمه “سبز” دسترسی پیدا کنند، که ممکن است باعث شود نگاه چشم خود را به هر چیزی که در صفحه نمایشگر سبز است تغییر دهد. این مفهوم توسط پاسخها در وظایف تداعی کلمه رایگان پشتیبانی میشود؛ وقتی از شرکتکنندگان خواسته میشود اولین کلمهای را که در هنگام خواندن کلمه قورباغه به آن فکر میکنند بنویسند، معمولاً پاسخ را سبز میدهند (به عنوان مثال، نلسون، مکیووی و شرایبر، 1998). جانسون، هوتیگ و مک کوئین (2008) این موضوع را با کودکان خردسالی که هنوز هیچ اصطلاح رنگی را یاد نگرفتهاند، بررسی کردند.
آنها کودکان دو ساله را از قبل در مورد درک آنها از اصطلاحات رنگ (مثلاً “به چیز قرمز اشاره کنید”) آزمایش کردند. آنها دریافتند که کودکان نوپا که برچسبهای رنگی را درک نمیکنند، حرکات چشمی مشابه با واسطه رنگ را به بزرگسالان نشان میدهند. بهعنوان مثال؛ وقتی از آنها خواسته شد که یک توت فرنگی پیدا کنند، با وجود اینکه قادر بهنام بردن رنگها نبودند، بیشتر به هواپیمای قرمز نگاه کردند تا هواپیمای زرد. این نتایج نشان میدهد که اثر رنگ در پارادایم دنیای بصری، حداقل در کودکان خردسال، با برچسبهای رنگی واسطه نمیشود.
در نهایت، به نظر میرسد که برخی از انواع دانش توسط شرکت کنندگان دنیای بصری اولویت بندی شده است. بهعنوان مثال، دانش مقولهای و عملکردی به ویژه جنبههای برجسته دانش واژگانی هستند (نگاه کنید به ماس، مک کورمیک؛ و تایلر، 1997). Huettig و Altmann (2011) دریافتند که نگاه کردن به یک رقیب رنگ سطح 400 میلی ثانیه بعد در شرایطی رخ میدهد که در آن یک رقیب معنایی در نمایشگر حضور دارد تا در شرایطی که در آن رقیب رنگ سطح تنها شی مرتبط در آن است. نمایش دادن. این دادهها همچنین جنبه مهمی از پارادایم را نشان میدهند، یعنی اینکه دوره زمانی نگاه به اهداف و رقبا در مطالعات جهان بصری باید با احتیاط تفسیر شود.
این واقعیت که حضور یک رقیب دیگر (مثلاً معنایی) زمانبندی را تغییر میدهد که رقیب رنگ سطح توجه آشکار را به خود جلب میکند، نشان میدهد که تغییر در نگاه چشم، حداقل در برخی موارد، بازتاب مستقیم فعالسازی نمایشهای متناظر نیست. این یافته که رقبای رنگ سطحی 400 میلیثانیه دیرتر از زمانی که رقبای معنایی حضور مشترک داشتند، توجه را به خود جلب کردند، نشان میدهد که (حتی برای اشیاء طبیعی که از نظر تشخیص رنگ نسبتاً بالایی دارند) دانش طبقهبندی / عملکردی برجستهتر است. جنبه دانش بیش از دانش رنگ است و توسط سیستم توجه در اولویت قرار دارد.
مطالعاتی که قبلاً مورد بحث قرار گرفت نشان داد که شنوندگان در پارادایم دنیای بصری از اطلاعات بصری و معنایی و مفهومی در مورد اشیاء هنگامی که ورودی دیداری و شنیداری را با هم ادغام میکنند، استفاده میکنند. با این حال، شواهدی از پارادایمهای دیگر وجود دارد که نشان میدهد بینندگان اغلب بهنام اشیاء دسترسی دارند، حتی زمانی که قصد نامگذاری آنها را ندارند (به عنوان مثال، مورسلا و میوزو، 2002؛ همچنین رجوع کنید به مایر و دامیان، 2007، مایر و همکاران، 2007، ناوارت و کاستا، 2005). بنابراین، میتوان تصور کرد که اشیاء نشان داده شده در مطالعات جهان بصری نام آنها را نیز فعال میکنند و این اطلاعات واژگانی ممکن است بر نقشه برداری شرکت کنندگان بین ورودی دیداری و گفتاری تأثیر بگذارد. نتایج بدست آمده توسط Huettig و McQueen (2007) این پیشنهاد را تایید میکند. در آزمایش 1، شرکت کنندگان اشیاء بصری را برای حدود سه ثانیه قبل از شروع هدف دیدند.
شرکتکنندگان قبل از اینکه به اشیایی که از نظر معنایی (مثلاً چنگال) و یا از نظر معنایی نگاه میکردند، نگاه چشم خود را به اشیایی معطوف کردند (مانند یک بیشتر) که شکل واجشناختی آنها همان واجهای اولیه کلمه را با کلمه هدف گفتاری داشت (مثلاً «پیکر»). از نظر بصری (به عنوان مثال، یک بوبین) شبیه به کلمه مورد نظر. تقدم زمانی تثبیتها به رقبای واجشناختی نشان میدهد که شرکتکنندگان قبل از شنیدن کلمات گفتاری انتقادی بهنام تصاویر دسترسی داشتند. علاوه بر این، تحقیقات در مورد تشخیص کلمات گفتاری قویاً نشان میدهد که تشخیص کلمه گفتاری یک فرآیند آبشاری است (برای بررسی به مککوئین، داهان و کاتلر، 2003 مراجعه کنید). با شنیدن کلمه هدف گفتاری، کلمات نامزد مختلف برای تشخیص به صورت موازی در سطح واجی نمایش رقابت میکنند، اگر با اطلاعات صوتی موجود در سیگنال گفتار سازگار باشند. پردازش در سطح واجی لازم نیست قبل از آبشار اطلاعات به موارد دیگر (مثلاً معنایی یا تصویری -f) تکمیل شود.
با این حال، برخی از پردازشهای واجشناختی به دلیل اولویت اطلاعات صوتی – آوایی در سیگنال گفتار، بر پردازش در سطوح دیگر نمایش مقدم هستند. Huettig و McQueen (2007) استدلال کردند که به همین دلیل است که تثبیت به رقبای واجی مقدم بر تغییر نگاه چشم به رقبای معنایی و بصری است: اطلاعات واج شناختی ابتدا از کلمات گفتاری قابل دسترسی است و میتواند ابتدا در فرآیند نگاشت بین کلمه گفتاری مورد استفاده قرار گیرد؛ و اشیاء بصری Huettig and McQueen ‘ s Experiment 2 پشتیبانی بیشتری برای این حساب فراهم میکند. قبل از شروع کلمه گفتاری فقط 200 میلی ثانیه نمایش بصری به شرکت کنندگان ارائه شد.
اکنون شرکتکنندگان رقبای واجشناختی را بیشتر از حواسپرتیهای نامرتبط ثابت نکردند. Huettig و McQueen (2007) استدلال کردند که این به این دلیل است که 200 میلی ثانیه زمان کافی برای بازیابی نام تصاویر قبل از اینکه رقیب واج شناختی یک فرضیه واژگانی قابل دوام نباشد، نبود. به عبارت دیگر؛ وقتی زمانی برای بازیابی نام تصاویر وجود نداشت، هیچ تثبیتی برای رقبای واجی وجود نداشت. این به شدت از این ایده حمایت میکند که نگاهها به رقبای واجشناختی در آزمایش 1 در واقع به دلیل نگاشت بازنماییهای واجشناختی بوده است.
در مجموع، مطالعات بررسیشده در این بخش نشان میدهد که شرکتکنندگان میتوانند اطلاعات واجشناختی، معنایی؛ و شکل بصری را از اشیاء موجود در نمایشگرهای بصری و از کلمات گفتاری بازیابی کنند و هر یک از این بازنماییها ممکن است برای فرآیند ادغام زبانی و غیر زبانی مهم باشد. – اطلاعات زبانی بنابراین به نظر میرسد که تغییرات توجه با نوع اطلاعات در نمایشگر (به عنوان مثال، تصاویر یا کلمات چاپ شده)، زمان پردازش آبشاری در سیستمهای تشخیص کلمه و تصویر، باز شدن زمانی اطلاعات در سیگنال گفتار، تعیین میشود. تعداد (و نوع) رقبا که در نمایشگر حضور دارند و تنظیم توجه شرکت کننده.
5. مطالعات تولید با استفاده از پارادایم دنیای بصری
پارادایم دنیای بصری در درجه اول برای مطالعه درک زبان گفتاری استفاده شده است. با این حال، تعدادی از مطالعات تولیدی وجود دارد که از روششناسی مرتبط استفاده کردهاند. در اینجا ما سه خط تحقیق تولید را مرور میکنیم: مطالعات تولید پیام، فرمولبندی بیان؛ و نظارت بر خود.
5.1. تولید پیام
یک مسئله مهم و تا حد زیادی حل نشده در تحقیقات فعلی تولید گفتار این است که سخنرانان چگونه پیامهای پیش کلامی تولید میکنند. اینها ساختارهای مفهومی هستند که محتوای گفته را تعیین میکنند و ورودی به فرآیندهای رمزگذاری زبانی را تشکیل میدهند (به عنوان مثال، Bock, Irwin, & Davidson, 2004). مطالعه تولید پیام به صورت آزمایشی مالیاتی است زیرا در استفاده روزمره از زبان، تولید پیام – که اساساً تصمیم گیری در مورد اینکه چه زمانی باید بگوییم – به بسیاری از عوامل اجتماعی، انگیزشی، شناختی و زبانی بستگی دارد که جداسازی و دستکاری آنها دشوار است. با این حال، جنبههای مهمی از تولید پیام وجود دارد که میتوان با درخواست از سخنرانان برای توصیف آنچه میبیند و هم گفتار و هم حرکات چشمشان را ضبط کرد، مطالعه کرد. این به شخص اجازه میدهد ردیابی کند که سخنرانان چه زمانی مواد خام بصری را برای تولید یک پیام به دست میآورند و این اطلاعات را با زمان، محتوا و شکل گفتههای خود مرتبط میسازند.
طبق دانش ما، گریفین و بوک (2000) اولین کسانی بودند که از ردیابی چشم برای مطالعه تولید پیام استفاده کردند. آنها از شرکتکنندگان خواستند کارتونهایی از رویدادها را توصیف کنند (مانند مردی که سگ را تعقیب میکند) و حرکات چشم خود را با حرکات چشمهایشان در کارهای کنترلی مختلف، از جمله کار تشخیص بیمار، که در آن شرکتکنندگان باید شخصیت رویدادی را که تحت آن قرار داشت شناسایی میکردند، مقایسه کردند. به جای انجام) اقدام. گریفین و بوک دریافتند که در ابتدا الگوهای نگاه در دو کار بسیار مشابه بودند، اما پس از حدود 300 میلی ثانیه احتمال تثبیت روی عامل و بیمار بین وظایف شروع شد: در شرح وظایف، سخنرانان ابتدا به عامل نگاه کردند. معمولاً اول از او یاد میکردند و اندکی قبل از ذکر آن به بیمار مراجعه میکردند. در مقابل، در تکلیف تشخیص بیمار، آنها به بیمار روی آوردند و به ندرت به عامل نگاه کردند. گریفین و بوک به این نتیجه رسیدند که الگوی نگاه گویندگان نشان دهنده وجود دو مرحله متمایز در پردازش تصاویر و گفتههای گفتاری است: مرحله دلهره حدود 300 میلیثانیه، که در طی آن رویداد را درک میکنند؛ و مرحله فرمولبندی زیر. که در طی آن شکل زبانی گفته را ایجاد میکنند. در مرحله دوم، سخنرانان به هر یک از اشیایی که نام میبرند به ترتیب ذکر نگاه میکنند.
تمایز بین مرحله دلهره و فرمولبندی توسط نتایج مطالعه بوک، ایروین، دیویدسون و لولت (2003) که تولید پیام و فرمولبندی زبانی را در گفتههای زمانگو بررسی کردند، پشتیبانی میشود. آنها به هلندیها و انگلیسی زبانان نمایشگر ساعت آنالوگ و دیجیتال ارائه کردند و از آنها خواستند که مطلق تولید کنند
عبارات (به عنوان مثال، “دو پنجاه”) یا عبارات نسبی (مثلا “ده تا سه”)، در نتیجه موقعیتهایی را ایجاد میکنند که شکل زبانی مورد نیاز کم و بیش با نمایشگر سازگار است (نمایشگرهای آنالوگ با عبارات نسبی سازگارتر هستند؛ نمایشگرهای دیجیتال سازگارترند. با عبارات مطلق) و با ترجیحات زمان گفتن سخنرانان (هلندی زبانان عبارات نسبی را ترجیح میدهند، در حالی که گویشوران انگلیسی آمریکایی عبارات مطلق را ترجیح میدهند). اثرات سازگاری و نوع نمایشگر وجود داشت، اما مهمتر از همه، از حدود 300 میلی ثانیه به بعد، نگاه چشم بلندگوها به نوع بیان بستگی داشت. هنگامی که بلندگوها عبارات نسبی (“ده تا سه”) را تولید میکردند، ابتدا به عقربه دقیقه نمایشگر آنالوگ یا قسمت سمت راست نمایشگر دیجیتال و سپس به عقربه ساعت یا قسمت چپ نمایشگر دیجیتال نگاه میکردند. الگوی مخالف برای عبارات مطلق (“دو پنجاه”) دیده شد. بوک و همکارانش نتیجه میگیرند که «یک رابط مؤثر بین آنچه دیده شده و آنچه گفته میشود، میتواند در عرض 300 میلی ثانیه ایجاد شود. این رابط زیربنای یک طرح یا پیام پیشکلامی است که به نظر میرسد فرمولبندی نسبتاً آهسته و شدیداً افزایشی عبارات را هدایت میکند» (ص. 653).
گلایتمن و همکاران (2007) همچنین از شرکت کنندگان خواست تا کاریکاتورهایی از اقدامات را توصیف کنند. در بیشتر آزمایشهای این مطالعه، یک نشانه بصری کوتاه قبل از شروع تصویر در موقعیت یکی از شخصیتهای صحنه ظاهر شد. اگرچه شرکتکنندگان نمیتوانستند به طور آگاهانه نشانهها را درک کنند، اما اولین تثبیتهای آنها بیشتر به سمت شخصیتهای نشانهگذاری شده بود تا شخصیتهای بدون نشانه. بهعلاوه، نشانهها بر نحوه توصیف گویندگان وقایع تأثیر میگذارند: نشانهها احتمال ذکر شخصیت نشانهشده را برای اولین بار در گفتار افزایش میدهند؛ و در رابطه با این موضوع، انتخاب فعل گویندگان را تغییر میدهند (مثلاً «تعقیب کردن» در مقابل “فرار”) یا انتخاب آنها از ساختار فعال در مقابل غیرفعال. گلیتمن و همکارانش پیشنهاد کردند که نشانه توجه بصری گویندگان را به خود جلب میکند و جهت توجه بصری به شخصیت نشانه گذاری شده، بازیابی نام شخصیت را تسهیل میکند، که به نوبه خود احتمال ذکر زودهنگام آن را افزایش میدهد. این نتایج کاملاً با پیشنهاد Bock و همکارانش مطابقت دارد که سخنرانان به سرعت اصل یک صحنه را درک میکنند و این نمایش اولیه تا حد زیادی تعیین میکند که مناطق مختلف صحنه بعداً به چه ترتیبی بازرسی و ذکر شوند. با این حال، تأثیر نشانههای بصری بر جهت تثبیتهای اولیه و روی شکل بیان نشان میدهد که ترسیم تمایز زمانی واضح بین مرحله درک صحنه کامل و مرحله رمزگذاری زبانی افزایشی بعدی دشوار است.
تعامل بین تولید پیام، به ویژه جذب اطلاعات جدید؛ و رمزگذاری دستوری توسط براون اشمیت و تاننهاس (2006) مورد مطالعه قرار گرفت. آنها از نمایشگرهایی استفاده کردند که چندین شی و یک وظیفه ارتباطی ارجاعی را نشان میداد، که در آن شرکتکنندگان عبارات اسمی مانند «مثلث کوچک» یا «مربع با مثلثهای کوچک» را تولید کردند. استفاده از صفت اندازه فقط زمانی ضروری بود که نمایشگر دارای یک شی متضاد باشد که فقط از نظر اندازه با هدف متفاوت باشد. نویسندگان دریافتند که سخنرانان زمانی که روی شیء کنتراست تثبیت کرده بودند، بسیار بیشتر از زمانی که این کار را انجام نداده بودند، از یک صفت استفاده میکردند. مهمتر از آن، زمان تثبیتها بر روی جسم کنتراست به روان بودن گفته مربوط بود. پیش از جملات روان از جمله صفتهای پیشنام، تثبیتهای قبلی به شیء متضاد نسبت به جملاتی که شامل تعمیر میشوند، مانند «مربع… کوچک» بودند. بنابراین، زمانبندی دریافت اطلاعات بصری سخنرانان پیامدهای مستقیمی بر روان بودن و شکل گفتههای آنها داشت. این نتایج ماهیت افزایشی تولید گفتار را برجسته میکند، بهعنوان مثال، به نظر میرسد که قطعات پیام که تقریباً با کلمات منفرد مطابقت دارند (بهعنوان مثال، کل عبارات یا جملات) به فرمولنویس منتقل میشوند (همچنین نگاه کنید به براون اشمیت و کونوپکا، 2008).
5.2. فرمول بیان
در خط دوم تحقیق تولید، ادراک نمایشگر و تولید پیام عمداً تا حد امکان ساده میشود، معمولاً با درخواست از شرکتکنندگان برای نامگذاری مجموعههایی از اشیاء به ترتیب ثابت؛ و ردیابی چشم برای مطالعه زمان استفاده میشود. دوره دسترسی واژگانی در جملات چند کلمهای، بهعنوان مثال، گویندگان چقدر جلوتر گفتههای خود را برنامه ریزی میکنند و آیا میتوانند چندین نام شی را به طور موازی بازیابی کنند. دسترسی واژگانی اغلب در پارادایمهایی بررسی میشود که تأخیرهای شروع گفتار را اندازهگیری میکنند، اما تأخیرها فقط شواهدی را در مورد زمانی که سخنرانان برای برنامهریزی اولین کلمه یک گفته نیاز دارند، ارائه میدهند. در مقابل، حرکات چشم را میتوان هم قبل و هم بعد از شروع گفتار ثبت کرد و همانطور که بعداً نشان داده خواهد شد، میتواند اطلاعات اضافی مهمی را در مورد نحوه هماهنگی گویندگان دریافت اطلاعات بصری، برنامهریزی زبانی و بیان با یکدیگر ارائه دهد.
این خط از تحقیقات ارتباط تنگاتنگی بین نگاه چشم سخنرانان و خروجی گفتار آشکار آنها را کشف کرده است. اول، مانند مطالعات تولید پیام، سخنرانان معمولاً به هر موضوعی که به آن اشاره میکنند، اندکی قبل از ذکر آن نگاه میکنند (گریفین، 2001، مایر و همکاران، 1998). این درست است حتی زمانی که آنها در بسیاری از آزمایشهای متوالی از همان اشیاء نام میبرند (Wheeldon, Meyer, & Van der Meulen, 2007). ثانیاً، ترتیب بازرسی اشیاء دقیقاً با ترتیب ذکر مطابقت دارد؛ و هنگامی که گویندگان در یک گفتار کوتاه دو بار در مورد یک شیء صحبت میکنند (مانند “جعبه کنار ستاره زرد است”)، تمایل به بازرسی دارند. شیء دو بار، اندکی قبل از شروع اولین کلمه که به شیء اشاره دارد (“جعبه”) و قبل از شروع کلمه دوم (“زرد”؛ Meyer, van der Meulen, & Brooks, 2004). بنابراین سخنرانان به شدت ترجیح میدهند به اشیایی که به آنها اشاره میکنند نگاه کنند، حتی زمانی که بتوانند به راحتی اطلاعات مربوطه را از حافظه کاری بازیابی کنند.
علاوه بر این، نشان داده شده است که زمان حرکات چشم سخنرانان به شدت با برنامه ریزی گفتار آنها هماهنگ است. مطالعات مختلف در مورد سهولت شناسایی اشیاء، انتخاب اقلام واژگانی مناسب و ایجاد فرمهای صوتی مربوطه، شواهد قوی ارائه کرده است که گویندگان معمولاً روی هر شیئی که نام میبرند ثابت میکنند تا زمانی که آن را تشخیص داده و شکل واجشناختی عبارت ارجاعکننده را بازیابی کنند (بلکه) و مایر، 2007، گریفین، 2001، لولت و مایر، 2000، مایر و همکاران، 2003، مایر و ون در مولن، 2000). بهعنوان مثال، سخنرانان به اشیاء با نام طولانیتر از اشیاء با نام کوتاه نگاه میکنند (مایر و همکاران، 2003؛ اما نگاه کنید به گریفین، 2003)، که نشان میدهد تغییر نگاه از یک شی به شیء بعدی تنها پس از واجشناسی رخ میدهد. شکل اولین نام شیء بازیابی شده است.
پیشنهادهای متفاوتی در مورد منشأ پیوند زمانی محکم بین حرکات چشم و برنامه ریزی گفتار ارائه شده است (برای بحث بیشتر به گریفین، 2004 مراجعه کنید). در بررسی این موضوع مهم است که در نظر داشته باشید که به طور کلی، نقطه نگاه یک فرد با کانون توجه بصری او مطابقت دارد؛ و اینکه توجه بصری فرد به یک شی احتمالا نه تنها شناسایی شیء را تسهیل میکند، بلکه همچنین بازیابی اطلاعات مرتبط، از جمله نام شی (به عنوان مثال، هامفریس و فورد، 2001، هامفریس و همکاران، 1997، رولوفز، 1992؛ همچنین نگاه کنید به گریفین، 2004؛ وور و فرینگز، 2008؛ وور، 2003 و وس. مایر و همکاران، 2007، مایر و همکاران، 2008، برای بحث بیشتر). دلیل احتمالی اینکه گویندگان به اشیا به ترتیب ذکر و تا زمانی که انجام میدهند، توجه میکنند این است که این امر تشخیص اشیاء، بازیابی واژگانی و فرآیندهای خود نظارتی درونی را که قبل از گفتههای آشکار انجام میشود، تسهیل میکند. این پیشنهاد به خوبی با شواهد اخیر که نشان میدهد حداقل برخی از مؤلفههای دسترسی واژگانی و نظارت بر خود به ظرفیت پردازش نیاز دارد و بنابراین از افزایش توجه سود میبرد، مطابقت دارد (به عنوان مثال، کوک و مایر، 2008، فریرا و پاشلر، 2002، Huettig و Hartsuiker، 2008، Huettig and Hartsuiker، 2010، Roelofs، 2007، Roelofs، 2008).
مطالعاتی که تاکنون مورد بحث قرار گرفتهاند نشان میدهند که سخنرانان جملات توصیفی ساده را به روشی بسیار افزایشی تولید میکنند، زیرا تنها زمانی به یک شی جدید روی میآورند که تقریباً آماده شروع نام شی فعلی هستند. با این حال، دادههای حرکات چشم ممکن است تا حدودی گمراهکننده باشند، زیرا چیزی که فرد روی آن ثابت میکند نباید تنها شیئی باشد که به آن توجه میکند. درعوض، بینندگان میتوانند از تمرکز توجه گسترده تری استفاده کنند و به طور موازی به چندین شیء توجه کنند (به عنوان مثال، Cave & Bichot، 1999). چندین مطالعه بررسی کردهاند که آیا این واقعاً در طول تولید گفتار اتفاق میافتد یا خیر (Meyer et al., 2008, Morgan and Meyer, 2005, Morgan et al., 2008). این مطالعات نتایج واضحی را به همراه داشته است: گویندگان میتوانند به طور موازی به دو شی – یک شی فوودار که میخواهند نام ببرند و یک شی خارج از فووئال که در ادامه نام خواهند برد – توجه کنند. علاوه بر این، پردازش شی خارج از فووئال میتواند برای فعال شدن نام آن به موازات شی فوو شده کافی باشد. با این حال، پردازش شیء موازی تنها زمانی اتفاق میافتد که شناسایی و نامگذاری هر دو شی نسبتاً آسان باشد. بهعنوان مثال، مالپاس و مایر (2010) دریافتند که اولین مورد از دو جسم برای مدت طولانیتری ثابت میشود و زمانی که شی دوم آسان بود نسبت به زمانی که نامگذاری آن دشوار بود، کندتر نامگذاری میشد. این نشان میدهد که این دو شی بهطور موازی پردازش شدهاند؛ و شی دوم آسانتر به سرعت نام خود را فعال میکند، که در بازیابی نام شی اول اختلال ایجاد میکند. این اثر تداخل زمانی ناپدید شد که پردازش بصری اولین شی با ارائه وارونه آن بیشتر شد. بنابراین مطالعه پردازش زبان موازی دو شی و بازیابی موازی نام آنها در شرایط مساعد امکان پذیر است. تحقیقات بیشتری برای تعیین شرایطی که در آن احتمال وقوع آن وجود دارد مورد نیاز است.
5.3. خودسازی نظارت بر کلمات گفتاری
تئوریهای نظارت بر گفتار (Hartsuiker and Kolk, 2001, Levelt, 1989, Postma, 2000) فرض میکنند که سخنرانان علاوه بر شنیدن گفتار آشکار خود، میتوانند یک بازنمایی درونی از گفتار برنامه ریزی شده خود را قبل از بیان بازبینی کنند (به دل و رپکا مراجعه کنید). ، 1992، لاکنر و تولر، 1979، موتلی و همکاران، 1982؛ اوپنهایم و دل، 2008، برای شواهد تجربی که این فرض را تأیید میکند). دو گزارش نظری از نحوه نظارت سخنرانان بر این بازنمایی داخلی وجود دارد. یک گزارش تأثیرگذار پیشنهاد میکند که نظارت داخلی ادراک گفتار را درگیر میکند (Levelt، 1989)، دیگری که دستگاههای داخلی تولید زبان را درگیر میکند (به عنوان مثال، Laver، 1980؛ برای بررسی، Postma، 2000 را ببینید). نظریههای مبتنی بر ادراک پیشبینی میکنند که گوش دادن به گفتار درونی خود پیامدهای رفتاری مشابه گوش دادن به گفتار دیگران دارد. برای آزمایش این دیدگاه، Huettig و Hartsuiker (2010) حرکات چشم را ثبت کردند در حالی که سخنرانان اشیاء را همراه با کلمات حواسپرتی نوشتاری مرتبط یا نامرتبط نامگذاری کردند.
در شرایط بحرانی، یکی از کلمات حواسپرتی از نظر واجی با نام شی مورد نظر مرتبط بود و دو کلمه نامرتبط بودند. Huettig و Hartsuiker (2010) دریافتند که شرکت کنندگان رقبای واج شناختی را بیشتر از حواس پرتیهای نامرتبط تثبیت میکنند. نکته مهم این است که دوره زمانی تثبیت رقبای واجشناختی در طول ادراک از خود بسیار شبیه به دوره زمانی مشاهده شده بود که شرکتکنندگان به سخنران دیگری گوش میدادند (Huettig & McQueen, 2007, Experiment 4) که نشان میدهد حرکات چشم توسط آشکار هدایت میشد؛ و نه درونی) گفتار. این مطالعه نشان میدهد که خود نظارتی بیرونی اما نه درونی مبتنی بر ادراک گفتار است. Huettig و Hartsuiker (2010) به این نتیجه رسیدند که نیاز به تئوریهای دقیقتر در مورد دیدگاه جایگزین، یعنی نظارت داخلی تولید وجود دارد. علاوه بر این، یافتههای آنها مبنی بر اینکه درک گفتار خود در حین بیان میتواند حرکات چشم را به روشی بسیار شبیه به گوش دادن به گفتار دیگران هدایت کند، پیوند تنگاتنگ بین پردازش زبان (خود تولید شده یا تولید شده توسط دیگران) و نگاه آشکار را برجسته میکند.
در مجموع، مطالعات تولید، درست مانند مطالعات درک مطلب، نشان داده است که بازرسی بصری بینندگان از نمایشگرها به شدت با پردازش زبانی آنها هماهنگ است. زیرا در هر دو مورد، حرکات چشم جهت توجه بصری را منعکس میکند. گویندگان و شنوندگان از توجه بصری استفاده میکنند تا به طور موثر با وظایف مربوطه خود در تولید جملات و نگاشت جملاتی که میشنوند بر روی آرایههای بصری کنار بیایند. به این معنا که افرادی که وظایف زبانی را انجام میدهند به اشیاء مربوطه نگاه میکنند نه تنها برای شناسایی این اشیاء، بلکه به این دلیل که نگاه کردن – یا، بهتر است بگوییم، حضور – بازیابی اطلاعات مربوط به این اشیاء را تسهیل میکند (نگاه کنید به گریفین و اوپنهایمر، 2006).
از این رو میتوان از ردیابی چشم برای تعیین زمان و مدت زمانی که بلندگوها (و شنوندگان) توجه خود را بر روی قسمتهای مختلف نمایشگر متمرکز میکنند استفاده کرد، اگرچه باید در نظر داشت که مناطقی که ثابت نیستند ممکن است پردازش شوند و بنابراین شروع نگاه به یک منطقه را نمیتوان با شروع پردازش یکسان کرد. شایان ذکر است که حرکات چشم نشان نمیدهد که چرا یک فرد به یک منطقه توجه میکند – مثلاً برای دیدن آن به وضوح یا بررسی اینکه آیا گفتهای که قبلاً تولید کرده است صحیح است یا خیر؛ و آنها نشان نمیدهند که چرا نگاه کردن به یک شیء طولانی یا کوتاه است – یک نگاه ممکن است طولانی باشد زیرا تشخیص آن شیء دشوار است یا به این دلیل که بازیابی نام مناسب برای گوینده دشوار است. برای تکرار، نگاه چشم نشان دهنده توجه بصری است؛ و هر متغیری که بر زمان و مدت زمانی که بیننده تصمیم میگیرد به یک شیء توجه کند، تأثیر میگذارد، احتمالاً بر زمان و مدت زمان نگاه کردن به آن نیز تأثیر میگذارد.
6. خلاصه و نتیجهگیری
نسخه درک مطلب از پارادایم دنیای بصری با سه ویژگی تعیین کننده مشخص میشود: (1) در هر آزمایش، شرکت کنندگان یک سخنرانی را میشنوند، (2) آنها همچنین یک نمایش بصری مربوطه را میبینند؛ و (3) حرکات چشم آنها برای آنها ثبت میشود. تحلیلهای بعدی در نسخه تولیدی پارادایم، به شرکتکنندگان نمایشهای بصری نشان داده میشود و به روشهای کم و بیش خاصی آموزش داده میشود تا در مورد آنها صحبت کنند. از آنجایی که محققان درک مطلب میتوانند هر نمایش بصری را با هر ورودی گفتاری ترکیب کنند؛ و به طور مشابه محققان تولید میتوانند از طریق سؤالات یا دستورالعملها، دامنه نامحدودی از گفتهها را استخراج کنند، این پارادایم بسیار متنوع است. شاید تا حدودی به طرز متناقضی، بیشتر تحقیقات دنیای بصری به پردازش زبان مربوط میشود، اما معیارهای وابسته، ساکادها و تثبیتها به کاوش بصری نمایشگرها مربوط میشود. دلیل موفقیت این رویکرد البته این است که حرکات چشم کاربران زبان به طور سیستماتیک با پردازش زبانی آنها مرتبط است. با این حال، ارتباط بین پردازش زبان و حرکات چشم سیستماتیک و قدرتمند، غیر مستقیم است.
در مطالعات درک مطلب، کلمات گفته شده چشم را به سمت اشیاء خاصی روی صفحه نمیکشند. در عوض، پیوند گفتار و چشم به این دلیل به وجود میآید که اطلاعات کلامی بر تخصیص توجه شنوندگان تأثیر میگذارد، که به نوبه خود جهت نگاه آنها را کنترل میکند. همانطور که قبلاً توضیح داده شد، در برخی از مطالعات جهان بصری؛ ورودی شفاهی دستورالعملهایی را برای شرکتکنندگان برای نگاه کردن یا حرکت دادن اشیاء در نمایشگر تشکیل میداد؛ و تعجب آور نیست که آنها واقعاً روی آن اشیا تثبیت شوند. در مطالعات دیگر، جایی که دستورالعمل خاصی در مورد هدف جملات و تصاویر داده نشده است، شرکت کنندگان احتمالاً گفتههای گفتاری را بهعنوان تفسیری بر روی نمایشگرها تفسیر میکنند، یا نمایشها را بهعنوان تصاویری از جملات گفتاری میبینند و هدفشان ایجاد بازنمایی ذهنی است. که این دو نوع اطلاعات را به شیوهای معنادار به هم مرتبط میکند. همانطور که قبلاً بحث کردیم، این کار را میتوان با هدایت توجه بصری به نهادهای مربوطه همانطور که ذکر شد، به بهترین نحو انجام داد.
به طور خلاصه، نگاه شنوندگان نشان دهنده کانون توجه بصری آنهاست; جایی که آنها توجه بصری خود را معطوف میکنند نه تنها به گفتههای گفتاری، بلکه به ویژگیهای اشیا یا به طور دقیقتر، به بازنمایی حافظه کاری شنوندگان از اشیاء بستگی دارد (به Huettig و همکاران، این شماره مراجعه کنید)؛ و همچنین به موارد بالاتر. فرآیندهای استنتاج در سطح (مثلاً در مورد دانش گوینده از نمایشگر)؛ و درک شنوندگان و مطابقت با خواستههای وظیفه. نظرات مشابه البته در مورد نسخه تولیدی پارادایم صدق میکند. در اینجا نیز نگاه چشم شرکتکنندگان نشاندهنده تخصیص توجه بصری آنها است و زمان و مدت زمانی که شرکتکنندگان به اشیاء در یک نمایشگر توجه میکنند نه تنها به ویژگیهای گفتههایی که آماده میکنند، بلکه به ویژگیهای نمایشگر نیز بستگی دارد.
این واقعیت که بسیاری از متغیرها میتوانند به طور بالقوه بر معیارهای وابسته تأثیر بگذارند، میتواند بهعنوان نقطه قوت پارادایم در نظر گرفته شود. زیرا در نسخههای مختلف پارادایم میتوان همه این تأثیرات و تعاملات آنها را بررسی کرد. همانطور که در این بررسی نشان داده شد، پارادایم کلمه بصری برای مطالعه نحوه درک شنوندگان و تولید سخنان توسط سخنرانان استفاده شده است. همچنین میتوان از آن برای مطالعه پردازش اشیاء در نمایشگر (به عنوان مثال، سرعت فعالسازی نام آنها)، یا برای ارزیابی عملکرد شنوندگان یا سخنرانانی که ممکن است در حفظ نمایشهای شی در حافظه کاری یا تمرکز مشکل داشته باشند، استفاده کرد. در مورد وظیفه (به عنوان مثال، فریدمن هیل و همکاران، 1995، ملت و همکاران، 2003). آن نسخههایی از پارادایم که در آن زوجهای شرکتکننده در تعامل هستند و به یکدیگر دستور میدهند تا اشیاء را جابجا کنند یا اطلاعاتی درباره اشیاء درخواست کنند، تقریبهای بسیار خوبی برای نحوه استفاده از زبان در زمینههای مکالمه روزمره هستند (همچنین رجوع کنید به Tanenhaus & Trueswell، 2006).
محدودیت آشکار پارادایم این است که گفتار ارائه شده یا استخراج شده همیشه باید با ورودی بصری مرتبط مرتبط باشد. برای تحقیق تولید، این بدان معنی است که این پارادایم فقط میتواند برای مطالعه نحوه تولید سخنان سخنرانان در مورد چیزهایی که میبینند (یا، در یک نسخه صفحه خالی از پارادایم تولید، چیزهایی که به تازگی دیدهاند) استفاده شود. بدیهی نیست که این پارادایم میتواند برای مطالعه نحوه تولید سخنان سخنرانان در مورد رویدادهای گذشته یا آینده، یا نحوه بیان شفاهی افکار یا احساسات انتزاعی مورد استفاده قرار گیرد. پارادایم دنیای بصری میتواند اطلاعاتی در مورد تولید پیام و فرمولبندی گفتهها درباره دنیای بصری ارائه دهد، اما نمیدانیم که این فرآیندها چقدر شبیه به فرآیندهایی هستند که وقتی سخنرانان در مورد دنیای بصری صحبت نمیکنند، بلکه از افکار و احساسات خود صحبت میکنند. برای مثال، میتوان حدس زد که دسترسی واژگانی توسط ورودی بصری پشتیبانی میشود و بنابراین در آزمایشهای دنیای بصری سریعتر از بسیاری از موقعیتهای دیگر، یا اینکه فرآیندهای خطیسازی (تصمیمگیری به ترتیب ارجاع به اشیاء مختلف) توسط آرایه بصری کنترل میشوند و به شیوهای منظمتر از حالت عادی رخ میدهند.
به دلیل پیچیدگی آزمایشهای دنیای بصری – این واقعیت که هم تولید یا درک گفتار و هم پردازش یک ورودی بصری درگیر هستند – تفسیر نتایج به ندرت ساده است. به طور خاص در مطالعات درک مطلب، تعیین سهم پردازش دیداری و شنیداری در الگوی یافتهها دشوار است. مسائل مهم این است که شنوندگان کدام بازنمایی از محرکهای دیداری و شنیداری را ایجاد میکنند و در کدام سطوح و چگونه حضور اطلاعات بصری بر پردازش اطلاعات شنیداری تأثیر میگذارد. این مهم است زیرا بیشتر محققین هدفشان توضیح رفتار شرکت کنندگان در آزمایش دنیای بصری خاص آنها نیست. بلکه هدف آنها تعمیم به طیف وسیع تری از موقعیتها است. در زیر، به بحث میپردازیم که چرا چنین تعمیمهایی میتوانند مشکلساز باشند (ر. ک. میچل، 2004).
در آزمایشهای دنیای بصری، پردازش بر اساس o است n هم ورودی دیداری و هم شنیداری. اطلاعات کمی در مورد ویژگیهای بازنمایی ورودی گفتار توسط شنوندگان وجود دارد؛ و دشوار است که بگوییم چگونه ممکن است با بازنماییهایی که وقتی تنها با اطلاعات شنیداری ارائه میشوند تفاوت داشته باشند (همچنین نگاه کنید به Kamide, Altmann and Haywood, 2003). کامید، شیپرز و آلتمن، 2003). برای مثال، نمایشهای فضایی ممکن است شنوندگان را از فرآیندهای تشریحی که در غیر این صورت انجام میشد منصرف کند، یا ممکن است استنتاجهایی را که معمولاً استخراج نمیشوند، دعوت کنند.
مطالعات دنیای بصری توسط آلتمن و همکارانش نشان داده است که شنوندگانی که جملاتی مانند “پسر میخورد… ” انتظار ادامه “کیک” را دارند، اگر این تنها شیء خوراکی در نمایشگر باشد؛ و شنوندگانی که “دختر خواهد خورد… ” سوار بر…» انتظار داشته باشید که ادامه به جای «موتور سیکلت» «چرخ و فلک» باشد. این مطالعات نشان دادهاند که شنوندگان هنگام پردازش گفتهها میتوانند از چه نوع اطلاعات و دانشی استفاده کنند، اما همانطور که آلتمن و همکارانش نیز اشاره کردهاند، به این معنا نیست که شنوندگان همیشه هنگام شنیدن جملات از این منابع استفاده میکنند. در واقع، برخی از آموزندهترین نتایج مطالعات جهان بصری شاید آنهایی باشد که نشان میدهد شنوندگان از 2 نوع خاصی از اطلاعات برای هدایت نگاه چشم استفاده نمیکنند، بهعنوان مثال، زمانی که شرکت کنندگان از دانش ذخیره شده رنگ اشیا برای هدایت توجه به اشیایی که با رنگ سیاه نشان داده شدهاند استفاده نمیکنند؛ و سفید (Huettig & Altmann, 2011).
وجود مجموعهای از جایگزینهای تصویری ممکن است بر نحوه پردازش کلمات فردی نیز تأثیر بگذارد. هندرسون و فریرا (2004) استدلال کردهاند که بافت بصری ممکن است «به موقعیتی منجر شود که در آن ورودی زبانی مستقیماً با مجموعه محدودی از امکانات مقایسه شود، نه حالت طبیعی که در آن ورودی باید امکانات و همچنین انتخاب را ایجاد کند. در میان آنها» (ص 48). آنها پیشنهاد کردند که تخمینهای دوره زمانی در مورد تشخیص کلمات گفتاری بر اساس نتایج دنیای بصری ممکن است به سمت سرعت بیشتر سوگیری شود. بهعنوان مثال، اگر شنوندگان در اولین لحظات شنیدن «انجام…» نگاه چشم خود را به سمت تصویر سگ معطوف کنند، این لزوماً به این معنا نیست که مردم به طور کلی کلمات گفتاری را به سرعت تشخیص میدهند. ممکن است صرفاً به این معنی باشد که اطلاعات صوتی کمی برای تمایز بین تعداد کمی از گزینههای موجود در نمایشگر ضروری است و این که سیستم در اصل از تحلیل زبانشناختی واژگانی آکوستیک معمولی عبور میکند و در عوض به نشانههایی ضربه میزند که به طور خاص برای بهینهسازی عملکرد در این کار انتخاب شدهاند. » (ص 48). با این حال، Dahan و Tanenhaus (2004) علیه این پیشنهاد استدلال کردهاند، بهعنوان مثال، اثرات فرکانس هدف دست نخورده (همچنین رجوع کنید به Dahan و همکاران، 2001) و اثرات تراکم همسایگی (همچنین رجوع کنید به Magnuson و همکاران، 2003، Magnuson et al. al., 2007)، حتی زمانی که هیچ شی رقیب نمایش داده نمیشد، که به این معنی است که شنوندگان به بازنماییهای ذخیره شده کلمات گفتاری در واژگان ذهنی خود دسترسی دارند. بنابراین دور زدن تحلیلهای واژگانی (اگر این امکان وجود داشته باشد) بعید است.
با این حال، اطلاعات بصری ممکن است به روشهای ظریفتری بر پردازش زبانی تأثیر بگذارد. بدیهی است که سرعت تشخیص کلمات گفتاری ممکن است از طریق آغازگرهای منشأ گرفته از نمایشهای بصری تحت تأثیر قرار گیرد. همانطور که قبلاً بحث شد، شواهد قوی وجود دارد که تصاویر اشیاء معمولی به سرعت نام آنها را فعال میکند (مانند Huettig and McQueen, 2007, Meyer and Damian, 2007, Morsella and Miozzo, 2002). این میتواند از تشخیص کلمات گفتاری به روشهای مختلف پشتیبانی کند. این میتواند تشخیص کلمات را سریعتر کند زیرا بازنمایی واژگانی آنها از قبل فعال شده است. دادههای اخیر از یک مطالعه مقدماتی متقابل وجهی با استفاده از وظیفه تصمیمگیری لغوی این دیدگاه را پشتیبانی میکند. مک کوئین و هوتیگ (2005) بازداری واج شناختی (برای اعداد اول تصویری که شروع واجی مربوط به جفتهای هدف ارائه شده به صورت صوتی بود) و تسهیل معنایی (برای همان دسته معنایی جفتهای اول – هدف) یافتند، که از این تصور حمایت میکند که تشخیص کلمات گفتاری میتواند تحتتاثیر منشا پرایمینگ از مشاهده اشیاء بصری قرار گیرد.
علاوه بر این، سرعت تشخیص کلمات گفتاری ممکن است تحت تأثیر قرار گیرد زیرا پرایمینگ توسط نمایشهای مشتق شده از دید، ابهام را کاهش میدهد. تعداد زیادی کلمه وجود دارد که معانی متمایز دارند (مثلاً «قلم» که به ابزار نوشتاری یا قفس اشاره میکند) یا حواس (مثلاً «مرغ» که به یک حیوان کامل یا گوشت اشاره دارد) اما واجشناسی یکسانی دارند. آغاز کردن توسط یک مرجع بصری خاص ممکن است دسترسی به آن معنا یا حس را در شنیدن کلمه گفتاری تسریع کند. به طور خلاصه، پارادایم دنیای بصری را نمیتوان برای استخراج تخمینهای قابل اعتماد از زمان مطلقی که شنوندگان برای تشخیص کلمات گفتاری نیاز دارند، استفاده کرد.
نوع دیگری از مشکل تفسیری ممکن است در مطالعاتی ایجاد شود که در آن رقبای مرتبط به منظور بررسی اینکه کدام گزینهها هنگام پردازش یک هدف در ذهن شنوندگان فعال میشوند، ارائه میشوند. بهعنوان مثال، آلوپنا و همکاران. (1998، بخش 4. 1.) را نشان داد
که شنوندگان با شنیدن “بیکر” هم به تصویر یک رقیب مربوط به شروع (سوسک) و هم به یک رقیب با نام قافیه (گوینده) نگاه کردند. بعید است که این نتایج منعکس کننده فرآیندهای استراتژیکی باشد که شرکت کنندگان به طور جدید در طول آزمایش توسعه میدهند. به احتمال زیاد شنوندگان همچنین رقبای ابتدایی کلمه و قافیه را در زمینههای دیگر فعال میکنند. با این حال، سنجش اهمیت جلوههای ضعیفتر (اثر قافیه در مثال) دشوار است. در پارادایم کلمه بصری، بازنمایی اشیاء رقیب در حافظه (کار) نگهداری میشود. این ممکن است منجر به فعال شدن نمایشهای واژگانی مربوطه شود و رقبا را قویتر از موقعیتهای دیگر کند.
سناریوی مخالف نیز ممکن است رخ دهد: نتایج یک آزمایش دنیای بصری ممکن است منجر به دست کم گرفتن احتمال فعال شدن یک نامزد واژگانی شود. این امکان قبلاً با استفاده از مطالعه Dahan و Tanenhaus (2004) بهعنوان مثال نشان داده شده بود، اما برای بسیاری از مطالعات دیگر نیز کاربرد دارد. رقبای واجشناختی (مثلاً «ربات») هدف (مثلاً «بوک») بیشتر از حواسپرتیهای نامرتبط ثابت نشدند، زمانی که هدف از یک بافت محدود معنایی پیروی کرد. با این حال، این لزوماً به این معنا نیست که بازنماییهای واژگانی رقیب اصلاً در زمینه محدود فعال نشده است. در عوض میتواند به این معنی باشد که فعال شدن رقیب در نگاه چشم منعکس نشده است. این به این دلیل است که توجه آشکار ممکن است منعکس کننده نتیجه فرآیندی باشد که زمینه را با دسترسی واژگانی اولیه (یعنی مبتنی بر فرم) ادغام میکند. همانطور که قبلاً اشاره شد، نگاه چشم معیاری برای توجه آشکار است و نه معیاری مستقیم برای فعال سازی بازنماییهای واژگانی.
در نهایت، محققین ممکن است علاقه مند به تعیین اینکه چه زمانی یا به چه ترتیبی انواع مختلف اطلاعات مرتبط با یک کلمه (مثلاً رنگ شیء مرجع و اطلاعات دسته معنایی) در دسترس میشوند، باشند. برای ارزیابی این موضوع، میتوان از نمایشگرهایی شامل هدف و رقبای مناسب استفاده کرد. با این حال، تفسیر نتایج چنین مطالعهای میتواند با این واقعیت پیچیده شود که زمان حرکات چشم شنوندگان به تعداد و ویژگیهای همه اشیاء در نمایشگر بستگی دارد. بهعنوان مثال، سورنسن و بیلی (2007) دریافتند که تعداد کل اشیاء نمایش داده شده در یک آزمایش بر زمان بندی تغییر نگاه چشم به رقبای معنایی تأثیر میگذارد.
آنها مشاهده کردند که هرچه اندازه آرایه بزرگتر باشد (چهار، نه یا شانزده شی)، اثرات رقابت دیرتر رخ میدهد (به Huettig و همکاران، این موضوع، برای توضیح محدودیتهای ظرفیت حافظه کاری این یافته مراجعه کنید). Huettig و Altmann (2011؛ به بخش 4. 4 مراجعه کنید) دریافتند که وقتی رقیب رنگ سطحی و رقیب معنایی در یک نمایش بصری یکسان حضور داشتند، شرکت کنندگان نگاه چشم خود را 400 میلی ثانیه دیرتر از زمانی که رقیب رنگی تنها رقیب رنگ بود، به سمت رقیب رنگی هدایت کردند. رقیب در نمایشگر حتی اگر جملات گفتاری در شرایط یکسان بودند. این یافتهها نشان میدهد که استفاده از زمانبندی تغییر نگاه چشم به رقبا در یک آزمایش دنیای بصری برای تخمین اینکه چه زمانی ممکن است در شرایط دیگر در دسترس باشد، نوع خاصی از اطلاعات مرتبط با یک کلمه گفتاری در دسترس است، دشوار است.
در مجموع، پارادایم دنیای بصری برای مطالعه نحوه تولید و درک سخنان افراد درباره اشیا و رویدادهایی که میبینند بسیار مناسب است. این موارد بسیاری از موقعیتهای روزمره را به تصویر میکشد که در آن افراد دستورالعملها یا دستورالعملهایی را برای عمل میدهند یا دریافت میکنند یا درباره وضعیت کف آشپزخانه، یک نقاشی انتزاعی، یا یک راننده بیپروا صحبت میکنند. بسیاری از فرآیندهای شناختی که در چنین شرایطی اتفاق میافتند را میتوان با استفاده از پارادایم دنیای بصری ارزیابی کرد. به ویژه، این یک روش عالی برای مطالعه تأثیر متقابل زبان، بینایی، حافظه و توجه است – فرآیندهای شناختی که به طور سنتی به صورت مجزا مورد بررسی قرار میگیرند، اما البته همه آنها در هنگام استفاده از زبان درگیر هستند. اگرچه ممکن است فرد اغلب فقط به یک جنبه خاص از عملکرد کاربران زبان علاقه مند باشد (مثلاً توانایی آنها در تشخیص انواع مختلف مصوتها)، تحقیقات تجربی باید همیشه توسط یک مدل نظری جامع هدایت شود که همه مؤلفههای شناختی درگیر را در بر میگیرد. در وظیفه این به این دلیل است که چنین چارچوبی برای تخمین اینکه کدام نتایج کلی را میتوان از یک مجموعه خاص از یافتهها گرفت، ضروری است.