Panduan Pemula untuk Ilmu Data – Menuju AI — Teknologi, Sains, dan Teknik Terbaik

Pengarang: Abid Ali Awan

Ilmu Data

Mengapa ilmu data begitu menarik, dan hal-hal apa yang perlu Anda ketahui sebelum memulai perjalanan Anda ke dunia keajaiban.

Gambar oleh starline

pengantar

Hai! nama saya Abid, dan saya akan menjadi pemandu Anda ke dunia Ilmu Data. Itu adalah perjalanan yang sulit dan panjang bagi saya, dan saya ingin membuat segalanya mudah bagi pemula yang berjuang untuk masuk. Sebelum memberi tahu Anda cara masuk, saya ingin memberi Anda cuplikan tentang apa yang Anda hadapi dan mengapa Anda harus pergi untuk Ilmu Data.

Mengapa Ilmu Data?

Mengapa saya cukup pribadi, dan ini terkait dengan perjuangan saya dengan penyakit mental. Penyakit mental di Pakistan semakin parah seiring berjalannya waktu, dan sepertiga dari generasi muda kita berjuang melawan depresi, dan tidak ada bantuan yang tersedia dari mereka; kami tidak memiliki infrastruktur untuk penyakit mental, yang cukup mengecewakan bagi saya ketika saya menghadapi masalah yang sama. Jadi, ketika saya pulih, saya menjadikan misi saya untuk membantu generasi muda dunia ini mendapatkan bantuan yang lebih baik dalam menangani penyakit mental. Di sinilah Ilmu Data dan pembelajaran mesin datang. Awalnya, saya tidak tahu bagaimana membuat kode atau bagaimana hal-hal ini bekerja, tetapi dengan dedikasi dan waktu, saya menjadi lebih baik dan lebih baik dalam memahami dunia ini, dan baru-baru ini saya menyusun sebuah artikel tentang Proposal Bisnis Produk AI, yang merupakan langkah pertama saya menuju membangun AI Umum yang akan mendeteksi penyakit mental menggunakan visi komputer, teks, dan audio. Latar belakang pendidikan saya sangat berbeda dari apa yang saya lakukan sekarang, jadi saya dapat meyakinkan Anda Jika saya bisa melakukannya, saya pikir siapa pun dengan laptop yang berfungsi dapat melakukannya. Anda membutuhkan waktu dan dedikasi, dan pintu dunia ini akan terbuka untuk Anda.

Hal kedua yang memotivasi saya adalah gaji dan tunjangan yang bagus dari pekerjaan Ilmu Data, dan dunia ini sangat membutuhkan lebih banyak insinyur data, analisis data, dan ilmuwan data. Jika Anda tidak percaya, Anda dapat pergi ke situs posting pekerjaan lokal atau internasional dan mencari Data Scientist.

Kredit: Pintu kaca

Distribusi Pembayaran

Dengan beberapa baris kode dan data yang tersedia untuk umum di Kaggle, kita dapat melihat distribusi gaji pokok dari Ilmuwan Data.

https://medium.com/media/20809f2b301103c6a4830c567614805a/href

Saya bahkan menemukan iklan Associate Data Scientist ini, yang cukup menarik jika Anda berasal dari negara berkembang. Bahkan di negara saya gaji untuk Data engineer dan Data scientist tiga kali lipat lebih banyak dari Dokter (sumber: kedua saudara perempuan saya adalah dokter).

Sumber: memang.com

Apa itu Ilmu Data?

Kredit: ETH Zurich

pengantar

Ilmu data adalah domain studi yang berhubungan dengan volume besar data menggunakan alat dan teknik modern untuk menemukan pola yang tidak terlihat, memperoleh informasi yang bermakna, dan membuat keputusan bisnis. Ilmu data menggunakan algoritma pembelajaran mesin untuk membangun model prediktif (simplelearn). Singkatnya, Anda mengumpulkan data dan menghasilkan informasi lengkap yang bermakna dengan menggunakan alat ilmiah. Ada banyak subbidang ilmu data, dan itu terus berkembang, jadi tanpa terlalu dalam, kita akan belajar tentang kelebihan dan kekurangan ilmu data untuk mempermudah pemahaman.

Gambar oleh Penulis | Elemen oleh Freepik

Keuntungan

Beberapa Pilihan Pekerjaan: Di dunia Data, Anda dapat menemukan banyak peluang kerja dalam organisasi seperti Ilmuwan Data, Analis Data, Analis Riset, Analis Bisnis, Manajer Analisis, dan Insinyur Big Data hanyalah pekerjaan utama yang disorot. Sebagian besar pekerjaan terkait Kecerdasan Buatan sangat diminati, dan setiap perusahaan membutuhkan analis data atau ilmuwan data untuk membantu mereka mengambil keputusan bisnis. (northeastern.edu) Manfaat Bisnis: Saat Anda menjadi ilmuwan data di organisasi, Anda memecahkan masalah bisnis dunia nyata, dan Anda juga membantu perusahaan, serta pemangku kepentingan lainnya membuat keputusan yang lebih cepat dan efektif tentang kinerja produk. Beberapa contoh untuk Manfaat bisnis: Pengambilan Keputusan yang Lebih Baik, Analisis yang Lebih Mudah Diakses, Otomatisasi, Model Prediktif, Personalisasi, Retensi & Loyalitas, Peramalan, Pesan & Solusi yang Dioptimalkan, dan Pengukuran ROI Kampanye yang Akurat. Pengembangan Tiempo Pekerjaan Bergaji Tinggi: Saya telah membahasnya, dan saya pikir ini adalah jalur cepat untuk menjadi jutawan karena upah tahunan rata-rata di atas 100k USD. Sebagian besar karyawan mendapatkan pengalaman dan memulai perusahaan data mereka sendiri, yang akhirnya berubah menjadi bisnis jutaan dolar. Produk AI Business Student.com: Produk AI menyenangkan untuk dimainkan, dan Anda secara langsung membantu komunitas memecahkan masalah dunia nyata. Seperti pengendalian kejahatan, efisiensi air, peramalan dan perancangan obat multiguna, deteksi dini kanker, dan masih banyak lagi. Kami menggunakan AI di setiap bidang kehidupan, dan rasanya sehat dan menyenangkan melakukan pekerjaan kami. Anda dapat menemukan lebih banyak contoh di Built In. Serbaguna: Izinkan saya memberi Anda sebuah contoh, karena keahlian saya di Natural Language Processing (NLP), dan bahkan saya tidak tahu segalanya tentang itu. NLP hanyalah bagian kecil dari dunia besar ini, dan ada dunia baru di dalam subbidang ini. Anda dapat melakukan klasifikasi teks, pengenalan ucapan otomatis, terjemahan mesin, pembuatan teks, jawaban pertanyaan, bot AI, gambar ke teks (OCR), dan banyak lagi. Terkadang saya merasa terbebani. Jadi, Anda akan memiliki kemungkinan tak terbatas untuk memilih niche Anda dan mengerjakannya.

Kekurangan

Ini adalah istilah yang kabur: Ilmu Data adalah istilah yang sangat umum dan tidak memiliki definisi yang jelas. Sulit untuk menuliskan definisi yang tepat dari Data Scientist. Misalnya, seorang analis data yang bekerja di excel dapat menyebut dirinya seorang ilmuwan data. Saat ini, perusahaan menggunakan kata ilmu data secara berlebihan untuk memasarkan produk mereka, dan beberapa perusahaan menggunakan kata ilmuwan data, tetapi sebenarnya mereka berarti ujung depan, penyebaran, analis, dan insinyur data, semuanya menjadi satu. Jadi, Anda perlu tahu apa yang dimaksud perusahaan dengan ilmu data saat melamar pekerjaan. Dunia besar untuk Dinavigasi: Ada begitu banyak bidang dan subbidang dalam Ilmu Data yang terkadang menakutkan bahkan untuk mulai mempelajari dasar-dasar karena ada begitu banyak tutorial yang tersedia secara online yang mengajarkan berbagai hal. Sulit bagi seorang individu dengan latar belakang non-pemrograman untuk terjun ke dunia ini karena begitu besar untuk diaktualisasikan dalam seminggu atau sebulan. Anda perlu waktu dan usaha untuk mendapatkan dasar-dasar yang benar, dan bahkan kemudian, orang bingung tentang bidang mana yang ingin mereka masuki dan alat apa yang perlu mereka pelajari. Seseorang dengan latar belakang Statistik mungkin tidak menguasai Ilmu Komputer dalam waktu singkat untuk menjadi Ilmuwan Data yang mahir. Oleh karena itu, ini adalah bidang dinamis yang selalu berubah yang mengharuskan orang untuk terus mempelajari berbagai cara Ilmu Data. (data-flair.training) Privasi Data/Basis Data: Bagi banyak industri, data adalah bahan bakarnya. Ilmuwan Data membantu perusahaan membuat keputusan berdasarkan data. Namun, data yang digunakan dalam proses dapat melanggar privasi pelanggan. (data-flair.training) Ada begitu banyak variabilitas keamanan dalam arsitek Data mana pun sehingga sulit untuk menjaga keamanan dan akses data. Jika kita melatih model pada data bias dari manusia, itu pasti akan menghasilkan hasil yang bias. Misalnya, generasi dalam teks, kami menyerap jutaan baris data teks yang memiliki bias negatif terhadap orang Afrika-Amerika, sehingga AI Generatif akan menghasilkan teks rasis. Diperlukan Banyak Domain: Seorang ilmuwan data biasanya harus mempelajari Teknik Data seperti jalur pipa data MLOps (MLFlow, AirFlow), penyerapan data, aplikasi front-end, tata kelola data, dan analisis perampingan yang harus dipelajari. Ini baru permulaan, dan ada begitu banyak subs yang diajukan dalam ilmu Data yang dibutuhkan oleh perusahaan selama proses perekrutan, seperti deret waktu, data tidak terstruktur, NLP, visi komputer, dan bidang AI lainnya yang muncul. Kadang-kadang membuat kewalahan betapa banyak orang perlu belajar dan terus belajar untuk tetap berharga di perusahaan. Alat apa yang cocok untuk Anda: Ini adalah dilema pemula tentang alat apa yang harus dipelajari terlebih dahulu atau lingkungan pengembangan terintegrasi (IDE) apa yang paling cocok untuk saya, atau bahasa pemrograman apa yang populer dalam ilmu data. Saya tahu ini membuat frustrasi, dan satu-satunya jalan keluar adalah dengan menggunakan IDE cloud yang dimuat sebelumnya. Terkadang Anda mulai mempelajari satu alat, tetapi perusahaan tempat Anda bekerja lebih memilih alat yang berbeda seperti desain R atau Tableau atau Dashboard. Ini cukup mengecewakan karena tidak ada alat standar di bidang ini.

Pikiran Akhir

Saya telah berbicara tentang perjuangan saya dan bagaimana saya masuk ke ilmu data yang merupakan pencapaian besar bagi saya, dan setiap hari saya semakin dekat dengan tujuan saya. Dalam dunia ilmu data, ada banyak penjaga gerbang, di mana para ahli akan meminta Anda untuk belajar matematika tingkat lanjut, pemrograman, alat, dan mendapatkan gelar resmi, tetapi hal-hal ini tidak penting dalam kehidupan nyata. Anda dapat belajar dari kursus online gratis; Anda dapat mempelajari dasar-dasar pemrograman, dan Anda dapat memilih IDE cloud gratis seperti Google Colab dan Deepnote untuk mulai mengerjakan proyek ilmu data sederhana. Jika Anda bertanya kepada saya, hanya dua hal yang Anda butuhkan adalah waktu dan dedikasi untuk mempelajari hal-hal ini.

Saya memulai perjalanan saya dengan kursus berbayar di DataCamp dan Codecademy. Kursus berbayar membuat Anda mendedikasikan diri untuk menyelesaikan kursus tepat waktu, dan mereka memiliki lingkungan coding interaktif yang akan membantu Anda belajar coding dengan cepat. Kursus-kursus ini juga menawarkan sertifikat kelulusan yang dapat Anda gunakan di resume atau LinkedIn Anda. Setelah Anda menguasai dasar-dasar pemrograman, saatnya bagi Anda untuk mulai mengerjakan proyek sederhana yang tersedia di internet, dan seiring waktu Anda akan menemukan niche Anda untuk dikerjakan. Jangan lupa untuk membagikan pekerjaan Anda di GitHub atau Medium, karena ini akan meningkatkan peluang Anda untuk dipekerjakan.

“Satu-satunya hal yang akan menghentikan Anda dari memenuhi impian Anda adalah Anda.” – Tom Bradley.

Panduan Pemula untuk Ilmu Data awalnya diterbitkan di Towards AI on Medium, di mana orang-orang melanjutkan percakapan dengan menyoroti dan menanggapi cerita ini.

Diterbitkan melalui Menuju AI

About The Author