no comments

Pemodelan Rasch

Gambaran keseluruhan

Teori Respon Perkara (juga dikenali sebagai Teori Ujian Moden) adalah pendekatan matematik untuk mengkuantifikasi ciri-ciri laten berdasarkan andaian asas bahawa tindak subjek kepada item adalah fungsi perbezaan antara 1) kebolehannya dan 2) ciri-ciri barang itu. Dalam kelas ini, model Rasch mendefinisikan khusus kesukaran / kemudahan sebagai parameter kepentingan tunggal ketika menilai item. Pendekatan ini telah dibangunkan pada tahun 1950 oleh ahli matematik Denmark, Georg Rasch sebagai alat untuk ujian pencapaian di kalangan kanak-kanak sekolah. Selain penggunaan berterusan dalam penilaian pendidikan, model Rasch digunakan secara meluas oleh sains sosial, yang sangat bergantung pada hasil yang dilaporkan oleh pesakit, dan lebih baru-baru ini,

Penerangan

Tujuan Model

Dalam bidang sains fizikal, asas (iaitu jisim & volum) dan diperolehi (pengesanan secara tidak langsung, iaitu kepadatan) pengukuran untuk mengukur sifat-sifat objek secara meluas. Bagaimanapun, disebabkan oleh sifat manusia yang kompleks, ukuran yang mampu menangkap sifat-sifat kepercayaan dan tingkah laku yang tidak dapat diobservasi adalah kurang jelas (“kita tidak dapat menyelaraskan fizikal jurang manusia” Bond & Fox 2012, ms 6). Para doktor dan penyelidik sering bergantung pada skala, indeks dan instrumen kuantitatif berasaskan item lain untuk mendapatkan pemboleh ubah untuk mengukur pembinaan laten. Sebagai contoh, soalan-soalan mengenai ketidakpuasan mungkin dimasukkan ke dalam skala yang dibangunkan untuk menilai kemurungan.

Analisis Rasch Terapan

Model Rasch dibina atas andaian bahawa prediktor yang paling parsimonious dan berkesan sifat adalah hubungan antara kesukaran item dan keupayaan seseorang. Ia berdasarkan logik yang mendasari bahawa subjek mempunyai kebarangkalian yang lebih tinggi dengan betul menjawab item yang lebih mudah dan kebarangkalian yang lebih rendah untuk menjawab item yang lebih sukar. Penyiasat memulakan pembangunan instrumen dengan mengkaji kesusasteraan yang sedia ada dan menilai sebarang pengetahuan terdahulu tentang sifat laten. Instrumen itu kemudiannya dipandu pada sampel yang memenuhi kriteria untuk populasi sasaran (mengingat umur, jantina, status kesihatan, dll) dan data yang dihasilkan dibandingkan dengan model Rasch. Rajah 1 di bawah (Bond & Fox 2007) dan langkah-langkah berikut menggariskan pendekatan yang diambil oleh model Rasch untuk menilai perkembangan instrumen berdasarkan data dikotom. Butiran teknikal disediakan di bahagian berikut.

  1. Kirakan peratus yang betul untuk setiap orang, ini akan menghasilkan skor mentah ordinal. Tukar peratusan skor mentah untuk setiap orang ke dalam peluang kejayaan dengan mengira nisbah peratus setiap orang yang betul dibahagikan dengan peratus tidak betul [(p) / (1-p)]. Ambil log kejayaan untuk mengira kebolehan orang. Transformasi ini menyelesaikan masalah mampatan di hujung skor mentah. Di plot, dataran biru mewakili kebolehan orang.
  2. Ulang langkah 1 untuk kesulitan item (peratus subjek yang menjawab item yang betul / peratus mata pelajaran yang dijawab tidak betul). Di atas plot, lingkaran merah jambu mewakili kesukaran Item.
  3. Plotkan anggaran-anggaran ini terhadap model Rasch yang ideal (sempurna unidimensionaliti), yang digambarkan pada plot sebagai garis menegak dan mewakili hubungan antara item dan keupayaan pada logit (nisbah log aka log). Logit purata (kebarangkalian kejayaan) ditetapkan kepada 0.
  4. Saiz setiap objek menyediakan perwakilan songsang ralatnya (objek kecil mempunyai ralat kurang). Ralat dijangka meningkat pada kedua-dua hujung garisan kerana sesetengah subjek mempunyai kebolehan yang rendah atau tinggi dan beberapa item dijaringkan tidak betul atau betul oleh semua subjek. Ketepatan item akan meningkat dengan peningkatan pentadbiran instrumen, manakala anggaran orang akan bertambah dengan penambahan item yang sesuai dengan instrumen tersebut.
  5. Menilai kesesuaian data empirikal ke garisan sempurna dari model Rasch. Nilai yang sesuai dibaca secara mendatar; subjek yang berada di luar jalan putih (-2.0 hingga 2.0 untuk N dari 30-300) dianggap tidak sesuai dan oleh itu tidak mengikuti corak tindak balas yang diharapkan.
  6. Sekiranya item dan / atau penyimpangan seseorang dijumpai, semak semula kata-kata item atau aspek lain yang salah dan ulangi langkah-langkah ini. Apabila data empiris sesuai dengan model Rasch, jumlah instrumen dianggap sebagai statistik yang mencukupi untuk digunakan dalam analisis masa depan.

Aspek Teknikal

Perwakilan Matematik
Apabila kita menganggarkan kebolehan subjek (Bn) dan kesukaran item, (Di) kita dapat menyatakan kebarangkalian kejayaan oleh Persamaan 1, yang menyatakan bahawa kebarangkalian jawapan yang betul untuk subjek n menghadap item i adalah fungsi logistik perbezaan antara keupayaan subjek dan kesukaran item.

Pni (x = 1) = f (Bn-Di) = e (Bn-Di) / 1 + e (Bn-Di), di mana x = 1 betul & x = 0 tidak betul (1)

Keupayaan & Estimasi Kesukaran
Menggunakan perisian statistik (lihat jadual di bawah), kebarangkalian kejayaan bagi setiap item dan subjek dianggarkan oleh Anggaran Maksimum Maksimum Maksimum Bersyarat *. Biasanya, taksiran subjek pada awalnya diabaikan dan anggaran item dikira, hasil ini kemudian digunakan untuk mengira pusingan pertama anggaran orang. Proses orang ulangan dan anggaran item terhadap satu sama lain terus sehingga perbezaan kesukaran keupayaan menumpu. Kaedah ini mungkin disebabkan oleh pemisahan parameter. Hasilnya adalah ukuran peringkat selang yang mewakili keupayaan seseorang tanpa kesulitan item. Statistik yang sesuai digunakan untuk membandingkan anggaran ini dengan model Rasch.
* Bergantung pada perisian yang digunakan pendekatan anggaran alternatif termasuk Anggaran Maksimum Kemungkinan Maksimum (JMLE), Penganggaran Maksimum Maksimum Marginal (MMLE), atau Anggaran Pairwise (PAIR).

Model Fit

Tahap percanggahan antara prestasi item diperhatikan dan prestasi item yang dijangkakan boleh diukur menggunakan statistik kebaikan yang sesuai. Unweighted (pakaian) dan wajaran (infit) bermakna statistik persegi dihitung dengan membandingkan data yang diperhatikan kepada matriks kebarangkalian model. Sisa-sisa yang diandaikan untuk mengikuti pengedaran chi-square dan patut diterima dikenal pasti oleh kebarangkalian chi-square melebihi 0.5. Statistik standard bersesuaian dikira berdasarkan skor t, dengan nilai yang boleh diterima dari -2 hingga + 2 (dijangka = 0). Di samping itu, ujian Wald boleh digunakan untuk mengenal pasti perkara-perkara tertentu yang tidak sesuai dan nisbah nisbah kebolehan boleh digunakan untuk menilai keseluruhan data yang sesuai.

Di samping itu, seperti yang ditunjukkan oleh Rajah 2 (J. Sick 2010  http://jalt.org/test/sic_5.htm) sesuai boleh dinilai secara visual dengan membina Curve Ciri Item (ICC). Paksi-x mewakili sifat laten pada skala logit dan paksi-y mewakili skor yang dijangkakan untuk item. Model Rasch meramalkan lengkung sigmoidal dan cita-cita data boleh dinilai berbanding dengan lengkung ini (data diperhatikan tidak digambarkan dalam angka). Item lebih mudah akan jatuh ke kiri 0 dan item yang lebih sukar akan jatuh ke kanan. Nilai anggaran item boleh dikenal pasti dengan mencari lokasinya pada paksi x apabila skor jangkaan adalah sama dengan 0.5.

Pelanjutan Model

  • Model Skala Penilaian (contohnya Skala Likert)
  • Model Kredit Separa
  • Ramai-Facet
  • Maklumat mengenai model IRT  2- dan 3-parameter

Glosari

  • Concatenation: gabungan unit sewenang-wenang yang menunjukkan hubungan aditif (linear); asas pengukuran asas
  • Pengukuran konjanji: peningkatan tahap atribut (iaitu kebarangkalian tindak balas yang betul) dengan kenaikan nilai dua atribut lain (iaitu kesukaran item dan keupayaan seseorang).
  • Bina kesahihan: sejauh mana instrumen atau ujian mengukur apa yang bertujuan untuk mengukur berdasarkan teori pendasarnya
  • Skala interval: skala ukuran di mana terdapat jarak yang sama antara unit
  • Invariance: konsistensi pengukuran dari satu keadaan ke satu sama lain, contohnya, ketabahan suatu langkah yang diperoleh (iaitu kepadatan) dalam menghadapi variasi langkah asas yang mendasari (iaitu jisim dan jumlah)
  • Pembolehubah laten: ciri yang dapat disimpulkan oleh pemerhatian tingkah laku dan bukan pengukuran langsung sifat
  • Pemisahan parameter: anggaran satu set parameter bebas daripada set parameter kedua
  • Unidimensionality: pengukuran berlaku hanya untuk satu atribut objek

 

SUMBER: Columbia University

KOMEN ANDA

Komen

TENTANG KAMI | PENAFIAN | HUBUNGI | HANTAR ARTIKEL