پایان نامه آماده کارشناسی ارشد | ۱-۲-۶-۳ مزایای پانل دیتا در مقایسه با داده های مقطعی یا سری زمانی – 4 |
در روابط فوق علائم به کار گرفته شده به ترتیب زیر معرفی میشوند:
Y: متغیر وابسته X: متغیر مستقل
b: ضریب رگرسیون r: ضریب همبستگی بین X و Y
Sy: انحراف از استاندارد متغیر وابسته Sx: انحرا از استاندارد متغیر مستقل
لازم به توجه است که ضریب تعیین در مقایسه با ضریب همبستگی، معیار گویاتری است.
۲-۶-۳مدل های رگرسیونی داده های ترکیبی[۶۷]
واژه رگرسیون برای اولین بار توسط گالتون[۶۸]، در سال ۱۸۷۷ به کار رفت. این واژه به معنی بازگشت بوده و نشان دهنده آن است که مقدار یک متغیر به متغیر دیگری مربوط است. مدلهای رگرسیون بر اساس این نظریه ساخته شده اند که اگر دو عامل با یکدیگر همبستگی داشته باشند، تغییر یکی با تغییر دیگری قرین خواهد شد. هر چه ارتباط دو عامل مذبور به یکدیگر نزدیکتر باشد، ضریب همبستگی تغییرات آن ها بزرگ تر و به حداکثر همبستگی یعنی ۱، نزدیکتر خواهد بود. بنابرین اگر روند گذشته نشان دهد که بین تغییر یک عامل و تغییرات چند عامل دیگر همبستگی معناداری وجود دارد، می توان تصور کرد که در آینده نیز همبستگی مذبور حفظ خواهد شد و اگر ضریب همبستگی مذبور را بدانیم، می توان اندازه تغییر عامل وابسته را نسبت به تغییر عامل مستقل مرتبط با آن، اندازه گیری و پیشبینی کنیم.
در اکثر مدلهای رگرسیونی، معمولا میخواهیم تغییرات یک متغیر را (y) بر حسب تعدادی از متغیرها (xها) که معتقدیم که باعث تغییرات y می شود توضیح دهیم. اغلب این کار را در قالب یک تابع انجام میدهیم:
رابطه ۱۳-۳)
k=1,2,…..,N i=1,2,…..,N
اندیس k تعداد متغیرهای توضیح دهنده را نشان میدهد. اغلب برای شروع، شکل این تابع را خطی فرض میکنند:
رابطه ۱۴-۳)
در اینجا اندیس i نشان دهنده تعداد مشاهداتی است که از هر متغیر در دست داریم. تعداد مشاهدات میتواند بر حسب زمان باشد، در این صورت yt و xkt را داریم که هر متغیر در طول سال، فصل، ماه و …. اندازه گیری می شود و خواهیم داشت t,…,1,2 =t به عبارت دیگر yt و xkt سری زمانی[۶۹] میباشند. یعنی یک متغیر واحد که مقادیر آن در فاصله زمانی مورد نظر بر اساس یک مکانیزم معین (مثلا یک مکانیزم آماری) تولید می شود. در حالت دیگر می توان در یک زمان خاص، برای مثال در یک سال معین، یک متغیر را در یک جامعه آماری اندازه گیری کرد. در این حالت یک مقطع از جامعه را در یک زمان خاص پیمایش کرده ایم که به زبان فنی تر آن را برش مقطعی[۷۰] می گوئیم.
با اعمال فرض های کلاسیک رگرسیون، مدل مذکور برای یافتن βها یا ضرایب تابع، برآورد می شود. با نقض فروض کلاسیک با مشکلاتی چون همبستگی پیاپی[۷۱] جملات اخلال یعنی tɛ در مدل های سری زمانی و واریانس ناهمسانی در مدل های مقطعی روبرو میشویم. آزمون های آماری در مورد ضرایب، آماره های R2 و F رگرسیون و نظایر آن به تعدادی مشاهدات یعنی، T در مورد سری زمانی و N در مورد داده های مقطعی و تعداد پارامترها (βهای) برآورد شده بستگی دارد (۱+K پرامتر یا β در مدل (۱۲) برآورد میشوند)، اغلب با یک مشکل عمومی در این مدلها روبرو میشویم، متغیرهای توضیحی یعنی xها با یکدیگر همخطی دارند که باعث می شود مقادیر درست βها برآورد نشود و استنتاج با مشکل مواجه شود.
در مدل های پانل دیتا، متغیرها را هم در میان مقاطع جامعه آماری و هم در طول زمان اندازه گیری میکنیم. البته باید توجه داشت که متغیر ها باید در طول سالها یکسان بمانند که در صورت عدم رعایت آن پانل نامتوازن[۷۲] خواهد بود.
به این ترتیب با دو بعد سروکار داریم: بعد زمان و بعد مقاطع، که آن را داده های گروهی- زمانی[۷۳] نیز میگویند.
واضح است که تعداد مشاهدات از یک متغیر، چندین برابر شده است، یعنی از T یا N در داده های سری زمانی یا داده های مقطعی به N × T در داده های پانل، افزایش یافته است. متغیرها در عرض جامعه اندازه گیری می شود و واریانس عرض، اطلاعات زیادی برای آزمون فرضیات فراهم می آورد. در طول دوره زمانی نیز همین متغیر اندازه گیری شده و واریانس آن در طول زمان میتواند اطلاعات مفیدی از پویایی های[۷۴] متغیر مربوطه در طول زمان برای آزمون فرضیات با ماهیتی دیگر فراهم کند و امکان مدل سازی شبیه آنچه در ادبیات سری زمانی مطرح است به وجود آید.
برای آشنایی بیشتر با پانل دیتا ابتدا نماد مدل خطی پانل دیتا را نشان میدهیم و سپس به معرفی نمایش ماتریسی خواهیم پرداخت:
رابطه۱۵-۳)
که به زبان ماتریسی به صورت زیر است:
رابطه۱۶-۳)
اندیس i برای افراد یا مقاطع ( تعداد N) و اندیس t برای زمان ( از ۱ تا T) در نظر گرفته شده است.
۱-۲-۶-۳ مزایای پانل دیتا در مقایسه با داده های مقطعی یا سری زمانی
الف) تعداد مشاهدات و داده ها در پانل دیتا بسیار بیشتر بوده و باعث می شود اعتماد به برآوردها بیشتر شود.
ب) به محققان تجربی اجازه میدهد مدل های پیشرفته تری را تبیین کرده و آزمون کنند که فرضیه های مقید کننده کمتری در بر داشته باشد.
ج) زیاد بودن تعداد مشاهدات مسئله همخطی بودن را نیز تا حدود زیادی حل میکند.
د) با این مجموعه داده ها می توان اثراتی را شناسایی و اندازه گیری کرد که در داده های مقطعی محض یا سری زمانی قابل شناسایی نیست.
ه) استفاده از داده های پانل دیتا تورش برآورد را از بین میبرد و یا کم می کند.
۷-۳ فرضیه های تحقیق
با توجه به آنچه که اشاره شد، فرضیه های تحقیق حاضر به ترتیبی زیر قابل تبیین است:
فرضیه اصلی: بین متغیرهای حسابداری و حجم معاملات رابطه معنی دار وجود دارد.
فرضیه فوق به پنج فرضیه فرعی به ترتیب زیر تقسیم بندی شده است:
فرضیه فرعی اول : بین نسبت قیمت به سود (P/E)و حجم معاملات سهام رابطه معنی دار وجود دارد.
فرضیه فرعی دوم : بین نسبت ارزش دفتری به ارزش بازار سهام (BV/MV) و حجم معاملات سهام رابطه معنی دار وجود دارد.
فرضیه فرعی سوم : بین نسبت Q توبین و حجم معاملات سهام رابطه معنی دار وجود دارد.
فرضیه فرعی چهارم : بین نسبت بازده سرمایه گذاری و حجم معاملات سهام رابطه معنی دار وجود دارد.
فرضیه فرعی پنجم : بین نسبت وجه نقد حاصل از عملیات به سود حاصل از عملیات و حجم معاملات سهام رابطه معنی دار وجود دارد.
۸-۳ روش آزمون فرضیه های تحقیق
در بسیاری از بررسی های اقتصادی همچون بررسی های پارش ناریان و آرتی پراسد[۷۵] در سال ۲۰۰۷، جادوری[۷۶] در سال ۲۰۰۴، حکیمه حاتف و احمد سروری در سال ۱۳۸۷ و احمد تشکینی و افسانه شفیعی در سال ۱۳۸۴ مدل OLS مورد استفاده قرار گرفته است. با این بیان در این تحقیق جهت آزمون فرضیات از مدل رگرسیونی OLS استفاده شده است
.
۱-۸-۳ مدل رگرسیون معمولی (OLS):
ساده ترین مجموعه فرضیات این است که رفتار متغیرها تماملاً یکسان ( و در طول دوره زمانی نیز یکسان) است و تمام مشاهدات همگن است ( از یک جامعه استخراج شده است). از لحاظ ریاضی داریم:
برای تمامی iها و tها
رابطه ۲۱-۳)
در این مورد، تمام فرضیات برای برآورد OLS رعایت می شود. K ضریب βk به سادگی به وسیله OLS روی داده ها تلقیق شده برآورد می شود و بسیار صرفه جویانه به شمار می رود.
۲-۸-۳ آزمون مانایی(استایی) متغیرها
فرم در حال بارگذاری ...
[دوشنبه 1401-09-28] [ 10:24:00 ب.ظ ]
|