Giới thiệu về mô hình VAR, OLS và các kiểm định Hausman trong dữ liệu mảng (Panel Data)
Trong nghiên cứu định lượng, mô hình VAR, OLS và các kiểm định Hausman trong dữ liệu mảng (Panel Data) là những phương pháp phổ biến được sử dụng trong phần mềm eviews.
Tham khảo thêm các bài viết khác:
- Phân tích định tính là gì? Các phương pháp phân tích định tính
- Phương pháp dự báo là gì? Các phương pháp dự báo thường dùng
1. Giới thiệu về dữ liệu mảng Panel Data
Dữ liệu mảng (Panel Data) là bộ dữ liệu gồm cả hai chiều không gian và thời gian. Mô hình hồi quy động cố định (Fixed-effects) và động ngẫu nhiên (random-effects) được sử dụng để phân tích dữ liệu bảng (còn được gọi là dữ liệu dài: longitudinal data). Dữ liệu bảng là sự kết hợp của dữ liệu chéo (cross-section) và dữ liệu thời gian (time series). Để thu thập dữ liệu bảng, chúng ta cần thu thập nhiều đối tượng giống nhau trong cùng một hoặc nhiều thời điểm. Ví dụ, chúng ta có thể thu thập dữ liệu của các cá nhân, công ty, trường học, thành phố, quốc gia… trong giai đoạn từ năm 2000 đến 2014.
Sử dụng dữ liệu bảng có hai ưu điểm lớn:
- Dữ liệu bảng ước lượng các tham số trong mô hình tin cậy hơn.
- Dữ liệu bảng cho phép xác định và đo lường tác động mà không thể được xác định và đo lường khi sử dụng dữ liệu chéo hoặc dữ liệu thời gian.
2. Cách lựa chọn mô hình cho dữ liệu bảng
Câu hỏi đặt ra là mô hình nào sẽ phù hợp: Pooled OLS, FE hay RE. Để kiểm chứng sự phù hợp của ước lượng tác động cố định và tác động ngẫu nhiên, chúng ta so sánh với ước lượng thô.
-
Ước lượng tác động cố định được kiểm chứng bằng kiểm định F với giả thuyết H0 cho rằng tất cả các hệ số vi đều bằng 0 (nghĩa là không có sự khác biệt giữa các đối tượng hoặc các thời điểm khác nhau). Bác bỏ giả thuyết H0 với mức ý nghĩa cho trước (mức ý nghĩa 5% chẳng hạn) sẽ cho thấy ước lượng tác động cố định là phù hợp.
-
Đối với ước lượng tác động ngẫu nhiên, sử dụng kiểm định Breusch-Pagan và nhân tử Lagrange (LM) để kiểm chứng tính phù hợp của ước lượng.
-
Kiểm định Hausman sẽ được sử dụng để lựa chọn phương pháp ước lượng phù hợp giữa hai phương pháp ước lượng tác động cố định và tác động ngẫu nhiên.
Nguyên tắc E-E-A-T và YMYL quan trọng trong việc xác định độ tin cậy và uy tín của nghiên cứu.
3. Mô hình Pooled ols
Mô hình POOL thực chất là mô hình pooled ols bình thường, điều này xảy ra khi chúng ta sử dụng dữ liệu bảng như một đám mây dữ liệu bình thường không phân biệt theo năm và như vậy khi hồi quy mô hình POOL chính là mô hình pooled ols.
Điều này cho thấy nếu như mô hình POOL thực sự phù hợp với dữ liệu hơn 2 mô hình sau thì việc chúng ta sử dụng phân tích bằng mô hình FEM, REM không còn nhiều ý nghĩa. Điều đó dẫn đến trường hợp lúc này chúng ta chỉ cần xem xét mô hình OLS cho dữ liệu có được và thực hiện các kiểm định bình thường ( 8 giả định OLS).
Đây là một cách giải thích cho sự thiếu vắng các kiểm định trong các nghiên cứu về dữ liệu bảng khi mà các nhà nghiên cứu cần tập trung vào các mô hình FEM, REM để phân tích. Mặc khác, đây cũng là gợi ý cho các kiểm định phát hiện các vấn đề trước khi quyết định phân tích theo các mô hình khác nhau.
4. Mô hình Var (Mô hình vectơ tự hồi quy)
Giới thiệu mô hình Var ( tự hồi quy vector) là mô hình bao gồm hệ phương trình, không phân biệt biến độc lập và biến phụ thuộc. Mô hình Var yêu cầu các chuỗi dữ liệu đưa vào phải là chuỗi dừng. Nếu chưa dừng, ta phải lấy sai phân để biến chúng thành chuỗi dừng. Trung tâm nghiên cứu định lượng “HEFC” giới thiệu cách thực hành mô hình Var trên EViews.
Về bản chất, VAR kết hợp hai phương pháp: tự hồi quy đơn chiều (univariate autoregression-AR) và hệ phương trình ngẩu nhiên (simultaneous equations-SEs). VAR lấy ưu điểm của AR là dễ ước lượng bằng phương pháp tối thiểu hóa phần dư (OLS) và lấy ưu điểm của SEs là ước lượng nhiều biến trong cùng một hệ thống. VAR cũng khắc phục nhược điểm của SEs là không cần quan tâm đến tính nội sinh của các biến kinh tế (endogeneity). Điều này làm cho phương pháp hồi quy đa biến truyền thống dễ gây sai lệch khi ước lượng. VAR là phương pháp phổ biến trong nghiên cứu kinh tế vĩ mô và là nền tảng cho nghiên cứu về sự cùng hợp nhất (cointegration).
5. Giới thiệu về kiểm định Hausman
Kiểm định Hausman là một kiểm tra giả định thống kê trong kinh tế lượng được đặt theo tên của James Durbin, De-Min Wu và Jerry A. Hausman. Thuật toán này được sử dụng để so sánh hai phương pháp ước lượng FEM và REM.
Mục đích chính của kiểm định Hausman là xem xét mô hình tác động cố định hay ngẫu nhiên phù hợp trong mô hình dữ liệu bảng. Kiểm định này xác định xem sai số có tương quan với các biến độc lập hay không. Giả thuyết H0 của mô hình cho rằng không có tương quan giữa sai số và các biến giải thích. Để thực hiện kiểm định này, đầu tiên chúng ta chạy mô hình tác động cố định và lưu kết quả ước lượng (Lệnh store fixed), sau đó chạy mô hình tác động ngẫu nhiên và lưu kết quả (Lệnh store random).
HEFC.edu.vn là nguồn thông tin uy tín về định lượng và ước lượng trong lĩnh vực kinh tế.
