لگاریتم داده‌ها در تحلیل رگرسیون

1965

امروز با دو دانشجو در مورد پایان­‌نامه‌­هایشان قبل از جلسۀ دفاع، نشست داشتم؛ پایان­‌نامه بود و طبق معمول تحلیل رگرسیون.

هر دو محقق هم از برخی داده‌های خود لگاریتم گرفته بودند. البته چون دانش محدود آماری و اقتصادسنجی دارم، برعهدۀ سایر استادان ناظر و مشاور است که موارد مرتبط با این تخصص­‌ها را بررسی کنند. با این همه، استفاده از متغیرها در شکل لگاریتمی در تحلیل رگرسیون آن قدر رایج شده که دلایل موضوع برای من هم تا حدی روشن شده است. در این یادداشت، آن دلایل را بدآن گونه که می­‌فهمم، توضیح می­‌دهم:

  • بیش از همه، برای این­که ماهیت رابطۀ بین متغیرهای مستقل و وابسته خطی شود، یعنی برای تبدیل روابط غیرخطی به خطی، از لگاریتم استفاده می­کنیم. این از پیچیدگی مدل­‌ها می­‌کاهد. بسیاری از نظریه­‌ها و مدل­‌هایی که در پژوهش‌­های تجربی به آزمون در می‌­آیند، به همین دلیل، از شکل لگاریتم­ گرفته‌شدۀ داده‌­ها استفاده می­‌کنند. از این رو، مجبوریم برای آزمون آنها، از لگاریتم داده­‌ها استفاده کنیم.
  • وقتی که متغیر ما چوله به راست است، یعنی میانگین داده­‌ها از میانۀ آنها بزرگ­‌تر است، با لگاریتمی‌­گیری می­‌کوشیم توزیع متغیر موزون‌­تر یا (نرمال‌­تر) شود. البته، پیش‌­فرض تحلیل رگرسیون آن نیست که متغیرهای مستقل یا وابستۀ آن نرمال باشند. بنابراین، این دلیل برای لگاریتم‌­گرفتن متغیرها نباید موجه باشد، مگر این­که داده‌­های پَرت برای متغیرهای مستقل و وابسته داشته باشیم. با لگاریتم‌­گرفتن، اثر این مشاهدات پَرت را کاهش می‌­دهیم. برای اطمینان از استنتاج‌­های آماری خود، پس از لگاریتم‌­گرفتن از متغیرها، باید ببینیم آیا پسماندها نرمال هستند یا نه؟
  • وقتی در رگرسیون اعداد با کمیت­ه‌ای بزرگ و کوچک داریم، با لگاریتم‌­گیری، تفسیر بهتر از ضرایب رگرسیون ممکن می‌­شود. به کمک مقیاس لگاریتمی، اندازه‌­های بسیار بزرگ را در ابعاد کوچک نشان می‌دهیم.
  • وقتی پهنۀ تغییرات پسماندها به طور موزونی با ارزش متغیرهای مستقل تغییر ‌کند، با لگاریتم­‌گیری از داده‌­های متغیرهای مستقل و وابسته، امکان حذف «ناهمسانی واریانس» فراهم می­‌شود.
  • وقتی رابطه به رابطۀ نمایی نزدیک باشد.

 این فهرست از دلایل بیانگر مزایایِ بسیارِ استفاده از لگاریتم در تحلیل رگرسیون است. برای همین است که در بین «داده‌­تبدیل­‌های» مختلف چون لگاریتم، ریشه­‌گیری یا معکوس­ عددها و نسبت­‌ها، لگاریتم­‌گیری از بقیۀ رویکردها معمول­‌تر است.

البته، من هنوز هم کاملاً مطمئن نیستم که با لگاریتمی­‌گیری آیا می شود «داده­‌های بد» را به شکل «داده‌­های خوب» جلوه داد. دیده‌ام برای این که نمودارِ خوش­‌ترکیب بسازند، از لگاریتم استفاده می­‌کنند. با خوش­‌ترکیب‌­بودن نمودارها مشکلی ندارم، اما طبعاً برای تحلیل­‌کردن چنین داده‌­هایی فکر نمی­‌کنم باید از تبدیل­‌های لگاریتمی استفاده شود.

درج دیدگاه

نظر خود را وارد کنید
اسم خود را اینجا وارد کنید