Saat Anda melamar posisi data science, Anda akan mendapat tes untuk menangani pengujian teknis yang sulit. Anda mungkin harus memecahkan teka-teki probabilitas, menulis beberapa SQL, dan beralih ke komunikasi dengan penguji Anda. Kunci untuk menangani tekanan selama proses wawancara adalah persiapan. Berikut beberapa pertanyaan yang sering ditanyakan dalam interview data science.

Pertanyaan dan Jawaban Wawancara Data Science

Interview Data Science

Sumber Foto : ekrut.com

Apa asumsi yang diperlukan untuk regresi linier?

Jawaban: Beberapa asumsi utama adalah (1) rendahnya atau tidak ada korelasi antara dua variabel, (2) ada hubungan linier antara variabel independen dan variabel dependen, dan (3) kesalahan residual berdistribusi normal.

Regresi linier mengasumsikan hubungan linier antara variabel independen dan variabel dependen. Contohnya, usia dan tinggi badan bisa sangat terkait, namun tidak secara linier, melainkan secara logistik. Ada titik di mana ketinggian cenderung stabil saat seseorang mencapai usia tertentu. 

Bagaimana Anda mengurutkan daftar angka yang besar?

Jawaban: Algoritme pengurutan yang umum adalah mergesort. Sederhananya, mergesort merupakan proses menyortir melalui pembagian daftar dan menyortir daftar secara independen, kemudian menggabungkan daftar independen untuk melakukan proses berulang yang sama.

Baik mergesort maupun quicksort dapat digunakan. Quicksort lebih cepat, sedangkan mergesort lebih stabil untuk data dengan angka yang sangat besar. Namun itu tergantung pada seberapa besar daftar angkanya dan berapa banyak memori yang digunakan komputer untuk mengurutkan angka tersebut. Untuk sebagian kasus, sebenarnya bisa digunakan algoritme pengurutan yang telah dibuat sebelumnya, misalnya fungsi “sortir” Python. 

Apa teknik visualisasi data favorit Anda?

Jawaban: Tugas data scientist adalah mengomunikasikan data dengan cara yang dapat dimengerti. Oleh karena itu, teknik visualisasi yang dipilih akan sangat bergantung pada konteks masalah, pesan yang ingin disampaikan, dan audiens. 

Dalam beberapa analisis, bisa digunakan clustermaps untuk memvisualisasikan data dalam berbagai dimensi. Bisa juga digunakan plot batang sederhana yang dapat menunjukkan tren fundamental dalam data, seperti mean dan deviasi standar.

Apakah lebih baik memiliki terlalu banyak false positive atau terlalu banyak false negative?

Jawaban: Tergantung masalahnya dan apa yang dipertaruhkan. Jika biaya false positive lebih tinggi daripada biaya false negative, lebih baik menggunakan model yang mengurangi biaya false positive.

Contohnya, dalam diagnosis kanker, Anda mungkin baik-baik saja dengan memiliki dua false positive untuk true positive. Karena false negative berpotensi kanker tidak terdiagnosis, sementara false negative dapat menyebabkan biopsi yang tidak perlu, namun tidak seburuk itu akibat false negative.

Contoh lainnya, Anda membuat mesin rekomendasi film. Dalam hal tersebut, false positive yang berlebihan dapat menyebabkan pengguna kehilangan kepercayaan pada alat Anda. Sedangkan false negative tidak terlalu buruk, karena ada banyak pilihan film yang bisa ditonton seseorang.

Ceritakan tentang saat Anda menyelesaikan konflik.

Jawaban: Dalam pertanyaan tersebut, Anda tidak hanya diharapkan memberikan jawaban terstruktur tetapi juga mengartikulasikan apa yang Anda pelajari dari pengalaman. Kerangka kerja STAR bisa berguna untuk membantu menyusun jawaban Anda: situation, task, action, dan result.

Semoga Anda bisa lebih siap menghadapi interview data science setelah mengetahui bocoran pertanyaan di atas ya.

Baca juga : Tips Ampuh untuk Junior Data Scientist Indonesia saat Baru Bekerja di Perusahaan


Klik dibawah ini untuk informasi tentang IT Training dan Info Loker seputar IT

Hubungi Kami

(Visited 25 times, 1 visits today)