پایان نامه آماده کارشناسی ارشد | ۱-۲-۶-۳ مزایای پانل دیتا در مقایسه با داده های مقطعی یا سری زمانی

در روابط فوق علائم به کار گرفته شده به ترتیب زیر معرفی می‌شوند:

Y: متغیر وابسته X: متغیر مستقل

b: ضریب رگرسیون r: ضریب همبستگی بین X و Y

S_y: انحراف از استاندارد متغیر وابسته S_x: انحرا از استاندارد متغیر مستقل

لازم به توجه است که ضریب تعیین در مقایسه با ضریب همبستگی، معیار گویاتری است.

۲-۶-۳مدل های رگرسیونی داده های ترکیبی^[۶۷]

واژه رگرسیون برای اولین بار توسط گالتون^[۶۸]، در سال ۱۸۷۷ به کار رفت. این واژه به معنی بازگشت بوده و نشان دهنده آن است که مقدار یک متغیر به متغیر دیگری مربوط است. مدل‌های رگرسیون ‌بر اساس این نظریه ساخته شده اند که اگر دو عامل با یکدیگر همبستگی داشته باشند، تغییر یکی با تغییر دیگری قرین خواهد شد. هر چه ارتباط دو عامل مذبور به یکدیگر نزدیکتر باشد، ضریب همبستگی تغییرات آن ها بزرگ تر و به حداکثر همبستگی یعنی ۱، نزدیکتر خواهد بود. ‌بنابرین‏ اگر روند گذشته نشان دهد که بین تغییر یک عامل و تغییرات چند عامل دیگر همبستگی معناداری وجود دارد، می توان تصور کرد که در آینده نیز همبستگی مذبور حفظ خواهد شد و اگر ضریب همبستگی مذبور را بدانیم، می توان اندازه تغییر عامل وابسته را نسبت به تغییر عامل مستقل مرتبط با آن، اندازه گیری و پیش‌بینی کنیم.

در اکثر مدل‌های رگرسیونی، معمولا می‌خواهیم تغییرات یک متغیر را (y) بر حسب تعدادی از متغیرها (xها) که معتقدیم که باعث تغییرات y می شود توضیح دهیم. اغلب این کار را در قالب یک تابع انجام می‌دهیم:

رابطه ۱۳-۳)

k=1,2,…..,N i=1,2,…..,N

اندیس k تعداد متغیرهای توضیح دهنده را نشان می‌دهد. اغلب برای شروع، شکل این تابع را خطی فرض می‌کنند:

رابطه ۱۴-۳)

در اینجا اندیس i نشان دهنده تعداد مشاهداتی است که از هر متغیر در دست داریم. تعداد مشاهدات می‌تواند بر حسب زمان باشد، در این صورت y_t و x_kt را داریم که هر متغیر در طول سال، فصل، ماه و …. اندازه گیری می شود و خواهیم داشت t,…,1,2 =t به عبارت دیگر y_t و x_kt سری زمانی^[۶۹] می‌باشند. یعنی یک متغیر واحد که مقادیر آن در فاصله زمانی مورد نظر ‌بر اساس یک مکانیزم معین (مثلا یک مکانیزم آماری) تولید می شود. در حالت دیگر می توان در یک زمان خاص، برای مثال در یک سال معین، یک متغیر را در یک جامعه آماری اندازه گیری کرد. در این حالت یک مقطع از جامعه را در یک زمان خاص پیمایش کرده ایم که به زبان فنی تر آن را برش مقطعی^[۷۰] می گوئیم.

با اعمال فرض های کلاسیک رگرسیون، مدل مذکور برای یافتن βها یا ضرایب تابع، برآورد می شود. با نقض فروض کلاسیک با مشکلاتی چون همبستگی پیاپی^[۷۱] جملات اخلال یعنی _tɛ در مدل های سری زمانی و واریانس ناهمسانی در مدل های مقطعی روبرو می‌شویم. آزمون های آماری ‌در مورد ضرایب، آماره های R² و F رگرسیون و نظایر آن به تعدادی مشاهدات یعنی، T ‌در مورد سری زمانی و N ‌در مورد داده های مقطعی و تعداد پارامترها (βهای) برآورد شده بستگی دارد (۱+K پرامتر یا β در مدل (۱۲) برآورد می‌شوند)، اغلب با یک مشکل عمومی در این مدل‌ها روبرو می‌شویم، متغیرهای توضیحی یعنی xها با یکدیگر هم‌خطی دارند که باعث می شود مقادیر درست βها برآورد نشود و استنتاج با مشکل مواجه شود.

در مدل های پانل دیتا، متغیرها را هم در میان مقاطع جامعه آماری و هم در طول زمان اندازه گیری می‌کنیم. البته باید توجه داشت که متغیر ها باید در طول سالها یکسان بمانند که در صورت عدم رعایت آن پانل نامتوازن^[۷۲] خواهد بود.

‌به این ترتیب با دو بعد سروکار داریم: بعد زمان و بعد مقاطع، که آن را داده های گروهی- زمانی^[۷۳] نیز می‌گویند.

واضح است که تعداد مشاهدات از یک متغیر، چندین برابر شده است، یعنی از T یا N در داده های سری زمانی یا داده های مقطعی به N × T در داده های پانل، افزایش یافته است. متغیرها در عرض جامعه اندازه گیری می شود و واریانس عرض، اطلاعات زیادی برای آزمون فرضیات فراهم می آورد. در طول دوره زمانی نیز همین متغیر اندازه گیری شده و واریانس آن در طول زمان می‌تواند اطلاعات مفیدی از پویایی های^[۷۴] متغیر مربوطه در طول زمان برای آزمون فرضیات با ماهیتی دیگر فراهم کند و امکان مدل سازی شبیه آنچه در ادبیات سری زمانی مطرح است به وجود آید.

برای آشنایی بیشتر با پانل دیتا ابتدا نماد مدل خطی پانل دیتا را نشان می‌دهیم و سپس به معرفی نمایش ماتریسی خواهیم پرداخت:

رابطه۱۵-۳)

که به زبان ماتریسی به صورت زیر است:

رابطه۱۶-۳)

اندیس i برای افراد یا مقاطع ( تعداد N) و اندیس t برای زمان ( از ۱ تا T) در نظر گرفته شده است.

۱-۲-۶-۳ مزایای پانل دیتا در مقایسه با داده های مقطعی یا سری زمانی

الف) تعداد مشاهدات و داده ها در پانل دیتا بسیار بیشتر بوده و باعث می شود اعتماد به برآوردها بیشتر شود.

ب) به محققان تجربی اجازه می‌دهد مدل های پیشرفته تری را تبیین کرده و آزمون کنند که فرضیه های مقید کننده کمتری در بر داشته باشد.

ج) زیاد بودن تعداد مشاهدات مسئله هم‌خطی بودن را نیز تا حدود زیادی حل می‌کند.

د) با این مجموعه داده ها می توان اثراتی را شناسایی و اندازه گیری کرد که در داده های مقطعی محض یا سری زمانی قابل شناسایی نیست.

ه) استفاده از داده های پانل دیتا تورش برآورد را از بین می‌برد و یا کم می کند.

۷-۳ فرضیه های تحقیق

با توجه به آنچه که اشاره شد، فرضیه های تحقیق حاضر به ترتیبی زیر قابل تبیین است:

فرضیه اصلی: بین متغیرهای حسابداری و حجم معاملات رابطه معنی دار وجود دارد.

فرضیه فوق به پنج فرضیه فرعی به ترتیب زیر تقسیم بندی شده است:

فرضیه فرعی اول : بین نسبت قیمت به سود (P/E)و حجم معاملات سهام رابطه معنی دار وجود دارد.

فرضیه فرعی دوم : بین نسبت ارزش دفتری به ارزش بازار سهام (BV/MV) و حجم معاملات سهام رابطه معنی دار وجود دارد.

فرضیه فرعی سوم : بین نسبت Q توبین و حجم معاملات سهام رابطه معنی دار وجود دارد.

فرضیه فرعی چهارم : بین نسبت بازده سرمایه گذاری و حجم معاملات سهام رابطه معنی دار وجود دارد.

فرضیه فرعی پنجم : بین نسبت وجه نقد حاصل از عملیات به سود حاصل از عملیات و حجم معاملات سهام رابطه معنی دار وجود دارد.

۸-۳ روش آزمون فرضیه های تحقیق

در بسیاری از بررسی های اقتصادی همچون بررسی های پارش ناریان و آرتی پراسد^[۷۵] در سال ۲۰۰۷، جادوری^[۷۶] در سال ۲۰۰۴، حکیمه حاتف و احمد سروری در سال ۱۳۸۷ و احمد تشکینی و افسانه شفیعی در سال ۱۳۸۴ مدل OLS مورد استفاده قرار گرفته است. با این بیان در این تحقیق جهت آزمون فرضیات از مدل رگرسیونی OLS استفاده شده است

۱-۸-۳ مدل رگرسیون معمولی (OLS):

ساده ترین مجموعه فرضیات این است که رفتار متغیرها تماملاً یکسان ( و در طول دوره زمانی نیز یکسان) است و تمام مشاهدات همگن است ( از یک جامعه استخراج شده است). از لحاظ ریاضی داریم:

برای تمامی iها و tها

رابطه ۲۱-۳)

در این مورد، تمام فرضیات برای برآورد OLS رعایت می شود. K ضریب β_k به سادگی به وسیله OLS روی داده ها تلقیق شده برآورد می شود و بسیار صرفه جویانه به شمار می رود.

۲-۸-۳ آزمون مانایی(استایی) متغیرها

موضوعات: بدون موضوع لینک ثابت

فرم در حال بارگذاری ...

فید نظر برای این مطلب