Bagaimana Saya Mempelajari R: Panduan Berita AS |  Pendidikan
Education

Bagaimana Saya Mempelajari R: Panduan Berita AS | Pendidikan

Pemrogram komputer muda membaca data pada PC di kantor.

(Gambar Getty)

Karena minat pada ilmu data telah melonjak, bahasa R melompat dari ceruk statistik ke arus utama pemrograman.

“R, relatif terhadap bahasa lain yang saya temui, dapat diakses, dibaca, dan serbaguna,” kata Jamie Hall, yang menggunakan R dalam pekerjaannya sebagai konsultan di Synapse Energy Economics.

Jadi apa yang dapat Anda lakukan dengan R?

Saya telah mendengarnya selama bertahun-tahun sebelum saya memutuskan untuk belajar R di awal tahun 2010-an.

Saya melihat presentasi oleh seorang jurnalis dari The New York Times di mana dia membuat ratusan grafik dengan beberapa baris kode. Itu tampak seperti sihir.

Lebih baik lagi, itu bukan hanya untuk grafis. Itu melakukan semua tugas statistik yang biasanya membutuhkan perangkat lunak mahal seperti SAS atau SPSS.

R telah ada selama beberapa waktu saat itu, dan ada materi online tentang apa yang dapat Anda lakukan dengan R. Jadi saya pikir saya akan bertanya kepada profesor Google dan langsung masuk.

Semuanya tampak sangat asing: Tabel data adalah “bingkai”, perhitungan sederhana tampaknya memerlukan notasi matematika kompleks yang belum pernah saya lihat sejak kuliah, dan Anda menggunakan panah “<-" yang aneh di mana pun saya pikir harus ada "=".

Lebih buruk lagi, bahkan buku-buku “mudah” tampak lebih dari sedikit menakutkan. Bahkan “R singkatnya” mencatat lebih dari 600 halaman.

Tetapi saya akhirnya menemukan apa yang sudah diketahui banyak pengguna R.

“Belajar sambil melakukan,” kata David Smith, advokat cloud di Microsoft yang bekerja dengan R.

“Temukan masalah data di area Anda, dan mulailah mengatasinya dengan R. Komunitas R menyediakan begitu banyak sumber daya untuk memulai, bahkan di area spesifik seperti keuangan atau epidemiologi.”

Sayangnya bagi saya, saya tidak berpikir untuk menangani tugas-tugas kecil yang dapat dikelola. Saya terus mencari sesuatu yang “besar” untuk dilakukan dengan R.

Jadi saya mengambilnya kemudian meletakkannya selama lebih dari setahun.

Proyek yang membuat saya merasa seperti pengguna R “nyata” muncul ketika seorang rekan kerja meminta saya untuk membantunya menganalisis perubahan nilai ujian di setiap distrik sekolah dan sekolah di Texas.

Kami perlu melakukan analisis, dan karena tidak semua orang yang mengerjakan proyek “mendapatkan” statistik, kami perlu membuat grafik untuk setiap tes, setiap sekolah, setiap kelas, dan setiap distrik sekolah.

Itu harus siap dalam dua minggu.

Satu-satunya cara yang saya tahu untuk membuat grafik sebanyak itu dengan cepat adalah dengan R paket ggplot.

Saya memiliki proyek besar saya. Berkat R, saya menghancurkannya.

Jadi tergantung pada sudut pandang Anda, saya perlu lebih dari satu tahun untuk belajar R atau sekitar 10 hari.

Tapi sementara 10 hari kerja sudah cukup untuk menguasai dasar-dasar dari R, saya seharusnya tidak memulai dengan proyek kerja besar dengan tenggat waktu yang ketat.

“Yang paling penting, menurut saya, adalah memfungsikan bahasa dengan mengerjakan a pribadi proyek,” kata Hall.

Dia menyarankan “sesuatu yang sangat sederhana” seperti menghitung pengeluaran pribadi mingguan rata-rata Anda.

“Saya masih terkejut bahwa ada kesan yang cukup luas bahwa R tidak bagus dalam tugas komputasi untuk keperluan umum,” kata Bob Rudis, salah satu penulis “Keamanan Berbasis Data” dan pengguna R yang rajin.

“Saya menjalankan R pada hal-hal seperti Raspberry Pi, di mana ia menggerakkan tampilan e-paper.”

Faktanya, ada lebih dari 16.000 paket R untuk berbagai macam tugas.

Paket-paket itu cenderung memiliki dokumentasi yang jauh lebih baik daripada kebanyakan perangkat lunak sumber terbuka. Selain dokumentasi, banyak paket memiliki seluruh makalah akademis yang ditujukan untuk menjelaskannya.

“Saya selalu bersemangat saat menemukan fungsi atau paket yang dibuat oleh pengguna biasa seperti saya dan yang dengan mulus memecahkan masalah yang saya alami,” kata Hall.

Namun, komunitas asli R muncul dari departemen statistik universitas, sehingga ia unggul dalam perselisihan data dan memiliki paket yang dirancang untuk menerapkan sejumlah besar metode statistik dan data.

Nilai khusus adalah alat untuk pengikisan web, berurusan dengan data media sosial, analisis teks, pembelajaran mesin, dan statistik survei yang kompleks.

Setelah analisis Anda selesai, Anda dapat menempatkan versi interaktif data Anda secara online menggunakan Berkilau.

Untuk menjadi sukses, teruslah menangani proyek.

“Menemukan masalah baru untuk dipecahkan setiap hari, bahkan jika itu masalah kecil, akan benar-benar membangun ‘memori otot’ R,’” kata Rudis.

Proyek-proyek itu tidak perlu rumit.

“Ketika saya pertama kali pindah ke Lembah Napa, saya memiliki tujuan untuk mengunjungi setiap kilang anggur dengan sepeda. Jadi saya menemukan sumber data di kilang anggur online, dan membuat saya sendiri peta menggunakan R,” kata Smith dari Microsoft.

Saat Anda mempelajari lebih lanjut, Rudis mengatakan menjawab pertanyaan R orang lain di Stack Overflow atau Reddit adalah cara yang bagus untuk masuk lebih dalam.

Ada banyak sumber daya yang bagus untuk mempelajari R. Berikut adalah beberapa yang terbaik menurut kategorinya.

Kursus online

Berikut ini adalah kursus online mandiri bagi orang-orang untuk belajar R. Ini sangat baik ketika Anda tidak memiliki masalah khusus untuk dipecahkan.

  • Swirl: Mengajarkan Anda pemrograman dengan menggunakan R dalam latihan interaktif mandiri.
  • Halaman RYouWithMe: Informasi gratis untuk mulai belajar R yang dibuat oleh anggota grup pengguna R-Ladies Sydney.
  • Literasi Data dan Visualisasi Data: Tidak dirancang secara khusus untuk mengajar R, rekaman YouTube dari kelas Ohio State University profesor Bear Braumoeller sangat cocok untuk mereka yang membutuhkan pengenalan metode statistik yang mudah diikuti.
  • Petualangan di R: Kursus tingkat perguruan tinggi delapan minggu gratis, sumber terbuka, di R untuk ilmu data dan statistik dengan opsi untuk membayar waktu tambahan dan peninjauan proyek bersama profesor, Dr. Kelly Bodwin.

Tutorial dan Panduan

Bila Anda ingin mengetahui cara melakukan tugas tertentu di R – dan saya sarankan untuk mempelajari cara ini – situs-situs ini memiliki petunjuk langkah demi langkah untuk membawa Anda ke sana.

  • Latihan R: Situs ini memiliki lebih dari 400 latihan untuk belajar melakukan sesuatu di R. Itu termasuk tutorial yang berkaitan dengan investasi, banyak informasi tentang penggunaan “data besar” dan bahkan seri khusus tentang pembelajaran R untuk dokter.
  • ComputerWorld: R Bahasa: Berkat semangat editor eksekutif IDG untuk data dan analitik, situs web ComputerWorld memiliki aliran artikel dan video praktis yang stabil.
  • R-Blogger: Ini tidak bagus, tetapi situs ini mengumpulkan posting blog tentang R dari seluruh web. Jadi ini adalah tempat yang bagus untuk mencari tutorial tentang apa pun dari A hingga Zillow.
  • Tampilan Tugas CRAN: CRAN, arsip utama paket R, memiliki daftar panduan topikal.

Buku

Saat ini, ada beberapa buku bagus tentang penggunaan R untuk berbagai tujuan. Berikut ini bagus untuk mereka yang memulai.

  • “The Book of R”: Buku yang cocok untuk pemula ini seperti mengikuti kursus R. Sebagai manfaat tambahan, bab sampel dan materi tambahan tersedia secara gratis sehingga Anda dapat mencoba sebelum membeli.
  • “R Cookbook”: Setelah Anda memiliki masalah untuk dipecahkan, buku yang baru saja diperbarui ini memberikan petunjuk langkah demi langkah untuk melakukan ratusan tugas berbeda.
  • “R untuk Ilmu Data”: Jelas merupakan buku yang lebih maju. Jika Anda menggunakan SPSS atau SAS, ini untuk Anda. Tersedia dalam bentuk cetak dan online.

Peralatan

Anda ingin mengunduh alat ini untuk pemrograman di R.

  • RStudio: RStudio sendiri adalah editor kode utama untuk menulis dan menjalankan skrip R. Situs perusahaan juga menawarkan banyak tutorial dan lembar contekan.
  • R Commander: Sosiolog John Fox menciptakan alat tunjuk dan klik ini untuk melakukan tindakan statistik umum di R. Ini bagus karena setelah Anda menggunakan antarmuka grafis, Anda dapat melihat kode yang dihasilkannya. Dia bahkan menulis buku tentang itu.
  • R Programming Compiler: Komputer terbaik adalah yang Anda miliki. Aplikasi ini memungkinkan Anda menulis dan menjalankan skrip R di iPhone atau iPad Anda. Ini juga memiliki versi untuk perangkat Android. Ini gratis untuk menginstal dan menjalankan skrip dasar, tetapi Anda perlu berlangganan agar benar-benar berguna.

Statistik Olahraga

Bagi mereka yang berada di liga fantasi, menerapkan statistik olahraga adalah cara yang bagus untuk belajar R dan mungkin mendapatkan keunggulan.

  • “Menganalisis Data Bisbol dengan R”: Pecandu bisbol, buku ini cocok untuk Anda. Ini benar-benar untuk orang yang sudah mengetahui dasar-dasar sabermetric (statistik bisbol). Ada juga buku serupa tentang menganalisis bola basket.
  • Fantasy Football Analytics: Situs ini bukan untuk orang yang lemah hati, tetapi tetap layak untuk dilihat. Serangkaian posting blog tentang membuat proyeksi sepak bola memberikan contoh yang bagus tentang penggunaan R di dunia nyata. Mereka bahkan telah menerbitkan semua alat mereka sebagai paket R yang mudah dijalankan yang disebut ffanalytics yang memungkinkan Anda melakukan banyak analisis sepakbola fantasi hanya dalam satu atau dua baris kode.
  • r/sportsanalytics: Banyak konten menarik yang terkait dengan data olahraga diposting dan dibahas di sub-Reddit Sports Analytics. Coba cari “R” untuk menemukan hal-hal yang menarik.

Posted By : keluar hk