اطلاعات واژگانی (Lexical Information)
ورودی مستقیم به تجزیه گر شامل مجموعه ای از کلمات میباشد که سمعک بصورت خطی قرار گرفته اند (یکی پس از دیگری). وظیفه تجزیه گر اینست که معین نماید این کلمات از لحاظ سلسله مراتب چگونه بهم مربوط میشوند. متریال واژگانی با حجم بالایی از اطلاعات نه تنها معنایی بلکه Morphosyntactic به سمت تجزیه گر می آیند.
ورودی های واژگانی حاوی اطلاعاتی هستند که هم درباره فریم های زیرگروهای افعال میباشد (یعنی مباحثی که یک فعل میتواند داشته باشد) و هم درباره اینکه چگونه افعال خاص اغلب بوسیله انواع خاصی از مباحث دنبال میشوند. ساختار جمله 7b اینجا تکرار میشود اما با از کجا سمعک بخرم محتوای نحوی متفاوت:
جمله حاوی یک ابهام ساختاری لوکال میباشد:
The problem میتواند مفعول مستقیم understood باشد و یا فاعل یک جمله واره جدید. با استفاده از minimal attachment ، تفسیر مفعول مستقیم بطور اولیه ترجیح داده میشود اما این مسئله وقتی که به کلمه had میرسیم منجر به garden path میشود.
ابهام لوکال در جمله 30 ، بناچار ناشی از این واقعیت میباشد که فریم زیرگروه برای understood اجازه یک مفعول مستقیم همچنین یک مکمل جمله ای را میدهد. افعال دیگر مثل think متفاوت میباشند و به مکملهای جمله ای اجازه میدهند (Mary thinks she know the truth) اما اجازه مفعول های مستقیم را نمیدهند (Mary thinks the truth).
علاوه بر این محدودیت های فریم زیرگروه، ورودی واژگانی برای یک فعل حاوی اطلاعاتی درباره اینست که مباحث احتمالی فعل بیشتر چه مواردی است. بعنوان مثال ، هم understand و هم admit مفعول مستقیم یا مکملهای جمله ای میگیرند اما مفعول مستقیم برای understand مرسوم تر است در حالیکه مکمل جمله ای برای admit مرسوم تر است.
Garnsey و همکارانش در سال 1997 داده های کلینیک سمعک وسیعی از افعال را تحت عنوان Verb’s argument Bias توسعه دادند که حاوی اطلاعاتی درباره اینکه کدام مباحث فعل مرسوم تر هستند. آزمایشات در این مطالعه از دو تکنیک مختلف برای اندازه گیری دشواری استفاده کردند:
درباره این سایت