- Beranda
- Website, Webmaster, Webdeveloper
Pekerjaan data scientist di Indonesia
...
TS
dataenthusiast
Pekerjaan data scientist di Indonesia
Salam agan-agan semua.
Saya baru nih gan. Mau sharing aja pengalaman ngobrol dengan beberapa founders startup di Jakarta.
Ternyata mereka lagi butuh banyak data scientist. Agan2 disini ada yang kerjaannya data scientist gak?
Atau ada temen yang tertarik untuk belajar data science atau data analysis?
Boleh komen di bawah ya gan, soalnya kalau ternyata ada banyak kita mau bikin workshop ttg data science gitu gan (phyton, R, machine learning)
Ditunggu gan jawabannya....
Apa yang dilakukan Data Scientist?
Rumitnya model analisa data dan beberapa kemungkinan penyimpangan perhitungan data merupakan tantangan tersendiri dalam bidang data science. Penyulingan informasi dari data yang tidak terstruktur adalah salah satunya, terutama bila fakta disembunyikan dalam teks. Tidak ada pendekatan umum terhadap penemuan informasi dari data tidak terstruktur. Penemuan informasi ini sifatnya sangat individual, spesifik sesuai tema, dan terbuka pada perubahan konstan. Sifat-sifat ini menuntut keterlibatan aktif data scientist. Seorang data scientist mungkin mengaplikasikan beberapa subproses ke mesin, namun penemuan secara keseluruhan tidak dapat ditemukan oleh mesin.
Penemuan informasi secara otomatis tidak ada gunanya jika melewatkan fakta-fakta penting. Dalam penemuan informasi, ada tahapan yang harus dilakukan secara individu, ad hoc, maupun bertujuan sementara. Sedangkan penemuan informasi otomatis hanya bisa fokus pada hal-hal utama, padahal banyak hal-hal pendukung dalam data yang juga dibutuhkan.
Penemuan hal-hal utama dalam data, misalnya harga saham dari layanan pasar saham atau data cuaca dari lembaga ramalan cuaca. Proses mengidentifikasi, mengekstrak, dan memvisualisasikan data ini sebenarnya dapat digunakan kembali oleh pengguna yang lain. Hal ini tentu juga berguna untuk mendapatkan hasil-hasil penemuan lanjutan dari data yang sama.
Jika dibandingkan dengan penemuan utama, penemuan lanjutan hanya dibutuhkan oleh sekelompok kecil atau beberapa individu. Data scientist mungkin harus melakukan analisa dari waktu ke waktu jika ingin mengetahui keluhan pelanggan dalam satu periode atau kegagalan produk tertentu. Informasi yang sesuai mungkin terdapat pada file teks atau email. Permintaan skala kecil yang berubah secara dinamis akan berdampak pada adaptasi sistem permanen, yang mana terlalu rumit dan mahal dalam sebagian kasus. Dengan solusi self-service yang fleksibel, data scientist bisa memperoleh manfaat penemuan informasi otomatis. Integrasi harmonis antara domain dan pengetahuan akan tool tertentu merupakan sebutan untuk solusi self-service bagi para data scentist. Oleh karena itu, data scientist diharapkan menguasai beberapa alat bantu yang sering digunakan dalam pengolahan data, seperti R, SQL, Phyton, Hadoop, SAS, Java, Hive, Matlab, dan lain-lain.
R bagi Data Scientist
R adalah bahasa pemrograman dan perangkat lunak untuk analisa statistika dan grafik. R dibuat oleh Ross Ihaka dan Robert Gentleman di Universitas Auckland, Selandia Baru, dan kini dikembangkan oleh R Development Core Team, dimana Chambers merupakan anggotanya. R dinamakan sebagian setelah nama dua pembuatnya (Robert Gentleman dan Ross Ihaka), dan sebagian sebagian dari nama S.
Bahasa R kini menjadi standar de facto di antara statistikawan untuk pengembangan perangkat lunak statistika, serta digunakan secara luas untuk pengembangan perangkat lunak statistika dan analisa data.
R merupakan bagian dari proyek GNU. Kode sumbernya tersedia secara bebas di bawah Lisensi Publik Umum GNU, dan versi biner prekompilasinya tersedia untuk berbagai sistem operasi. R menggunakan antarmuka baris perintah, meski beberapa antarmuka pengguna grafik juga tersedia.
R menyediakan berbagai teknik statistika (permodelan linier dan nonlinier, uji statistik klasik, analisa deret waktu, klasifikasi, klasterisasi, dan sebagainya) serta grafik. R, sebagaimana S, dirancang sebagai bahasa komputer sebenarnya, dan mengizinkan penggunanya untuk menambah fungsi tambahan dengan mendefinisikan fungsi baru. Kekuatan besar dari R yang lain adalah fasilitas grafiknya, yang menghasilkan grafik dengan kualitas publikasi yang dapat memuat simbol matematika. R memiliki format dokumentasi seperti LaTeX, yang digunakan untuk menyediakan dokumentasi yang lengkap, baik secara daring (dalam berbagai format) maupun secara cetakan.
Saat ini, R dapat difungsikan dalam beberapa hal sebagai berikut.
• R adalah perangkat lunak analisa data: data scientist, ahli statistik, dan analis - siapa saja yang perlu memahami data, benar-benar dapat menggunakan R untuk analisa statistik, visualisasi data, dan pemodelan prediktif.
• R adalah bahasa pemrograman: Bahasa berorientasi pada objek yang dibuat oleh ahli statistik. R menyediakan objek, operator, dan fungsi yang memungkinkan pengguna untuk mengeksplorasi, memodelkan, dan memvisualisasikan data.
• R adalah lingkungan untuk analisa statistik: Metode statistik standar mudah diterapkan di R. Lalu, karena sebagian besar penelitian mutakhir dalam statistik dan pemodelan prediktif dilakukan di R, teknik yang baru dikembangkan seringkali tersedia di R lebih dahulu.
• R adalah proyek perangkat lunak sumber terbuka: R gratis. Berkat pengawasan serta pengeditan bertahun-tahun oleh pengguna dan pengembang, R memiliki standar kualitas dan ketepatan numerik yang tinggi. Pintu R yang terbuka memungkinkannya untuk berintegrasi dengan aplikasi dan sistem lainnya.
• R adalah sebuah komunitas: Sebuah proyek R telah berkembang dan mencakup lebih dari 20 statistisi dan ilmuwan komputer dari seluruh dunia, serta ribuan kontributor telah menciptakan paket tambahan. Dengan dua juta pengguna, R menawarkan komunitas online yang dinamis.
Data Scientist sedang dibutuhkan dimana-mana
Pekerjaan data scientist berada dalam posisi yang sangat dibutuhkan saat ini. Banyak perusahaan yang berani membayar tinggi para professional data scientist. Keahlian yang dibutuhkan merupakan perpaduan statistik, bisnis intelijen, sosilogi, ilmu komputer, dan komunikasi. Selain menguasai angka dan hitungan, seorang data scientist harus juga piawai berkomunikasi; ahli secara analitik dan dapat berpikir imajinatif. Untuk menjadi data scientist yang sukses, kalian harus familiar dengan 5 kompetensi dasar: programming, statistics, machine learning, data mining, dan visualisasi data.
"Data scientist tentu butuh keterampilan teknis untuk mengekstrak data dan menjalankan analisa statistik, namun harus juga mampu menemukan pola atau penyimpangan yang harus dilaporkan," kata Erik Berger, seorang Senior Web Technology Manager yang telah bekerja sebagai data scientist selama 14 tahun. "Untuk menjadi ahli dalam hal ini, kamu perlu memahami sepenuhnya bisnis yang sedang dianalisa- kalau hanya melihat jumlah angka yang ada, itu masih setengah jalan."
Jika kamu punya apa yang saat ini diperlukan oleh data scientist, akan ada banyak sekali perusahaan yang membutuhkan kamu. McKinsey Global Institute telah memprediksi bahwa pada tahun 2018, Amerika Serikat mungkin akan kekurangan 140.000 hingga 190.000 karyawan dengan kemampuan analisa mendalam, serta kekurangan 1,5 juta manajer dan analis yang mampu menganalisa data sampai menghasilkan keputusan dari data tersebut.
Dalam sebuah survei yang dilakukan oleh Robert Half Technology terhadap 1.400 Chief Innovation Officer (CIO) di Amerika Serikat, sebanyak 53% responden menyatakan bahwa perusahaan mereka kekurangan staf yang mampu mengakses data dan menghasilkan insight dari data tersebut. Ini artinya, data scientist sangat dibutuhkan.
Bukan hanya di Amerika, data scientist juga sedang menjadi pekerjaan yang sangat menjanjikan di Indonesia. Memang sampai saat ini belum data data rata-rata gaji untuk data scientist di Indonesia karena pekerjaan ini termasuk pekerjaan yang baru. Namun, banyak perusahaan yang berinvestasi tinggi pada data scientist di Indonesia. Perusahaan tersebut tidak segan-segan memberikan gaji yang sangat besar bagi mereka.
Bersumber dari Techinasia, salah satu perusahaan penyedia transportasi online di Indonesia, menghargai seorang data scientist yang berpengalaman 1-4 tahun hingga Rp 30juta per bulannya. Tentu saja gaji ini dapat disesuaikan kembali berdasarkan kualifikasi dan pengalaman yang dimiliki data scientist tersebut.
Masih dikutip dari Techinasia, perusahaan telekomunikasi di Indonesia seperti PT Telkom Indonesia, Indosat Ooredoo, dan lainnya telah menerapkan data science dalam proses bisnisnya. Misalnya, dengan menganalisa perilaku pelanggan IndiHome, PT Telkom Indonesia berhasil menurunkan tingkat churn rate (persentase pelanggan yang berhenti berlangganan) pelanggan broadband, dari lima persen menjadi tiga persen pada tahun 2015. Ini bisa meningkatkan migrasi rasio pelanggan dari free ke berbayar untuk layanan Flashzone, dari 11 persen melonjak ke 20 persen. Pencapaian ini tentu sangat menguntungkan perusahaan.
Jakarta merupakan kota yang paling banyak membutuhkan data scientist karena banyaknya perusahaan yang berkembang di kota ini. Munculnya banyak perusahaan startup, seperti Bukalapak, Salestock, Traveloka, Blibli, Kudo, dan lainnya juga bisa menjadi kesempatan emas bagi para data scientist untuk mengembangkan karir di bidang ini. Sayangnya, pasokan data scientist yang masih kurang menjadi masalah bagi sebagian perusahaan. Mereka berani merogoh kocek untuk membiayai mahal seseorang menjadi data scientist di perusahaannya.
Kebutuhan akan data scientist tentu saja bukan hanya oleh perusahaan startup, tapi juga oleh korporat yang lebih besar. Kenyataan bahwa pasokan kecil akan data scientist yang handal di bidangnya membuat banyak perusahaan kesulitan mencari sumber daya manusia yang bisa membantu berjalannya bisnis mereka.
Saya baru nih gan. Mau sharing aja pengalaman ngobrol dengan beberapa founders startup di Jakarta.
Ternyata mereka lagi butuh banyak data scientist. Agan2 disini ada yang kerjaannya data scientist gak?
Atau ada temen yang tertarik untuk belajar data science atau data analysis?
Boleh komen di bawah ya gan, soalnya kalau ternyata ada banyak kita mau bikin workshop ttg data science gitu gan (phyton, R, machine learning)
Ditunggu gan jawabannya....
Quote:
Apa yang dilakukan Data Scientist?
Rumitnya model analisa data dan beberapa kemungkinan penyimpangan perhitungan data merupakan tantangan tersendiri dalam bidang data science. Penyulingan informasi dari data yang tidak terstruktur adalah salah satunya, terutama bila fakta disembunyikan dalam teks. Tidak ada pendekatan umum terhadap penemuan informasi dari data tidak terstruktur. Penemuan informasi ini sifatnya sangat individual, spesifik sesuai tema, dan terbuka pada perubahan konstan. Sifat-sifat ini menuntut keterlibatan aktif data scientist. Seorang data scientist mungkin mengaplikasikan beberapa subproses ke mesin, namun penemuan secara keseluruhan tidak dapat ditemukan oleh mesin.
Penemuan informasi secara otomatis tidak ada gunanya jika melewatkan fakta-fakta penting. Dalam penemuan informasi, ada tahapan yang harus dilakukan secara individu, ad hoc, maupun bertujuan sementara. Sedangkan penemuan informasi otomatis hanya bisa fokus pada hal-hal utama, padahal banyak hal-hal pendukung dalam data yang juga dibutuhkan.
Penemuan hal-hal utama dalam data, misalnya harga saham dari layanan pasar saham atau data cuaca dari lembaga ramalan cuaca. Proses mengidentifikasi, mengekstrak, dan memvisualisasikan data ini sebenarnya dapat digunakan kembali oleh pengguna yang lain. Hal ini tentu juga berguna untuk mendapatkan hasil-hasil penemuan lanjutan dari data yang sama.
Jika dibandingkan dengan penemuan utama, penemuan lanjutan hanya dibutuhkan oleh sekelompok kecil atau beberapa individu. Data scientist mungkin harus melakukan analisa dari waktu ke waktu jika ingin mengetahui keluhan pelanggan dalam satu periode atau kegagalan produk tertentu. Informasi yang sesuai mungkin terdapat pada file teks atau email. Permintaan skala kecil yang berubah secara dinamis akan berdampak pada adaptasi sistem permanen, yang mana terlalu rumit dan mahal dalam sebagian kasus. Dengan solusi self-service yang fleksibel, data scientist bisa memperoleh manfaat penemuan informasi otomatis. Integrasi harmonis antara domain dan pengetahuan akan tool tertentu merupakan sebutan untuk solusi self-service bagi para data scentist. Oleh karena itu, data scientist diharapkan menguasai beberapa alat bantu yang sering digunakan dalam pengolahan data, seperti R, SQL, Phyton, Hadoop, SAS, Java, Hive, Matlab, dan lain-lain.
R bagi Data Scientist
R adalah bahasa pemrograman dan perangkat lunak untuk analisa statistika dan grafik. R dibuat oleh Ross Ihaka dan Robert Gentleman di Universitas Auckland, Selandia Baru, dan kini dikembangkan oleh R Development Core Team, dimana Chambers merupakan anggotanya. R dinamakan sebagian setelah nama dua pembuatnya (Robert Gentleman dan Ross Ihaka), dan sebagian sebagian dari nama S.
Bahasa R kini menjadi standar de facto di antara statistikawan untuk pengembangan perangkat lunak statistika, serta digunakan secara luas untuk pengembangan perangkat lunak statistika dan analisa data.
R merupakan bagian dari proyek GNU. Kode sumbernya tersedia secara bebas di bawah Lisensi Publik Umum GNU, dan versi biner prekompilasinya tersedia untuk berbagai sistem operasi. R menggunakan antarmuka baris perintah, meski beberapa antarmuka pengguna grafik juga tersedia.
R menyediakan berbagai teknik statistika (permodelan linier dan nonlinier, uji statistik klasik, analisa deret waktu, klasifikasi, klasterisasi, dan sebagainya) serta grafik. R, sebagaimana S, dirancang sebagai bahasa komputer sebenarnya, dan mengizinkan penggunanya untuk menambah fungsi tambahan dengan mendefinisikan fungsi baru. Kekuatan besar dari R yang lain adalah fasilitas grafiknya, yang menghasilkan grafik dengan kualitas publikasi yang dapat memuat simbol matematika. R memiliki format dokumentasi seperti LaTeX, yang digunakan untuk menyediakan dokumentasi yang lengkap, baik secara daring (dalam berbagai format) maupun secara cetakan.
Saat ini, R dapat difungsikan dalam beberapa hal sebagai berikut.
• R adalah perangkat lunak analisa data: data scientist, ahli statistik, dan analis - siapa saja yang perlu memahami data, benar-benar dapat menggunakan R untuk analisa statistik, visualisasi data, dan pemodelan prediktif.
• R adalah bahasa pemrograman: Bahasa berorientasi pada objek yang dibuat oleh ahli statistik. R menyediakan objek, operator, dan fungsi yang memungkinkan pengguna untuk mengeksplorasi, memodelkan, dan memvisualisasikan data.
• R adalah lingkungan untuk analisa statistik: Metode statistik standar mudah diterapkan di R. Lalu, karena sebagian besar penelitian mutakhir dalam statistik dan pemodelan prediktif dilakukan di R, teknik yang baru dikembangkan seringkali tersedia di R lebih dahulu.
• R adalah proyek perangkat lunak sumber terbuka: R gratis. Berkat pengawasan serta pengeditan bertahun-tahun oleh pengguna dan pengembang, R memiliki standar kualitas dan ketepatan numerik yang tinggi. Pintu R yang terbuka memungkinkannya untuk berintegrasi dengan aplikasi dan sistem lainnya.
• R adalah sebuah komunitas: Sebuah proyek R telah berkembang dan mencakup lebih dari 20 statistisi dan ilmuwan komputer dari seluruh dunia, serta ribuan kontributor telah menciptakan paket tambahan. Dengan dua juta pengguna, R menawarkan komunitas online yang dinamis.
Data Scientist sedang dibutuhkan dimana-mana
Pekerjaan data scientist berada dalam posisi yang sangat dibutuhkan saat ini. Banyak perusahaan yang berani membayar tinggi para professional data scientist. Keahlian yang dibutuhkan merupakan perpaduan statistik, bisnis intelijen, sosilogi, ilmu komputer, dan komunikasi. Selain menguasai angka dan hitungan, seorang data scientist harus juga piawai berkomunikasi; ahli secara analitik dan dapat berpikir imajinatif. Untuk menjadi data scientist yang sukses, kalian harus familiar dengan 5 kompetensi dasar: programming, statistics, machine learning, data mining, dan visualisasi data.
"Data scientist tentu butuh keterampilan teknis untuk mengekstrak data dan menjalankan analisa statistik, namun harus juga mampu menemukan pola atau penyimpangan yang harus dilaporkan," kata Erik Berger, seorang Senior Web Technology Manager yang telah bekerja sebagai data scientist selama 14 tahun. "Untuk menjadi ahli dalam hal ini, kamu perlu memahami sepenuhnya bisnis yang sedang dianalisa- kalau hanya melihat jumlah angka yang ada, itu masih setengah jalan."
Jika kamu punya apa yang saat ini diperlukan oleh data scientist, akan ada banyak sekali perusahaan yang membutuhkan kamu. McKinsey Global Institute telah memprediksi bahwa pada tahun 2018, Amerika Serikat mungkin akan kekurangan 140.000 hingga 190.000 karyawan dengan kemampuan analisa mendalam, serta kekurangan 1,5 juta manajer dan analis yang mampu menganalisa data sampai menghasilkan keputusan dari data tersebut.
Dalam sebuah survei yang dilakukan oleh Robert Half Technology terhadap 1.400 Chief Innovation Officer (CIO) di Amerika Serikat, sebanyak 53% responden menyatakan bahwa perusahaan mereka kekurangan staf yang mampu mengakses data dan menghasilkan insight dari data tersebut. Ini artinya, data scientist sangat dibutuhkan.
Bukan hanya di Amerika, data scientist juga sedang menjadi pekerjaan yang sangat menjanjikan di Indonesia. Memang sampai saat ini belum data data rata-rata gaji untuk data scientist di Indonesia karena pekerjaan ini termasuk pekerjaan yang baru. Namun, banyak perusahaan yang berinvestasi tinggi pada data scientist di Indonesia. Perusahaan tersebut tidak segan-segan memberikan gaji yang sangat besar bagi mereka.
Bersumber dari Techinasia, salah satu perusahaan penyedia transportasi online di Indonesia, menghargai seorang data scientist yang berpengalaman 1-4 tahun hingga Rp 30juta per bulannya. Tentu saja gaji ini dapat disesuaikan kembali berdasarkan kualifikasi dan pengalaman yang dimiliki data scientist tersebut.
Masih dikutip dari Techinasia, perusahaan telekomunikasi di Indonesia seperti PT Telkom Indonesia, Indosat Ooredoo, dan lainnya telah menerapkan data science dalam proses bisnisnya. Misalnya, dengan menganalisa perilaku pelanggan IndiHome, PT Telkom Indonesia berhasil menurunkan tingkat churn rate (persentase pelanggan yang berhenti berlangganan) pelanggan broadband, dari lima persen menjadi tiga persen pada tahun 2015. Ini bisa meningkatkan migrasi rasio pelanggan dari free ke berbayar untuk layanan Flashzone, dari 11 persen melonjak ke 20 persen. Pencapaian ini tentu sangat menguntungkan perusahaan.
Jakarta merupakan kota yang paling banyak membutuhkan data scientist karena banyaknya perusahaan yang berkembang di kota ini. Munculnya banyak perusahaan startup, seperti Bukalapak, Salestock, Traveloka, Blibli, Kudo, dan lainnya juga bisa menjadi kesempatan emas bagi para data scientist untuk mengembangkan karir di bidang ini. Sayangnya, pasokan data scientist yang masih kurang menjadi masalah bagi sebagian perusahaan. Mereka berani merogoh kocek untuk membiayai mahal seseorang menjadi data scientist di perusahaannya.
Kebutuhan akan data scientist tentu saja bukan hanya oleh perusahaan startup, tapi juga oleh korporat yang lebih besar. Kenyataan bahwa pasokan kecil akan data scientist yang handal di bidangnya membuat banyak perusahaan kesulitan mencari sumber daya manusia yang bisa membantu berjalannya bisnis mereka.
Diubah oleh dataenthusiast 12-07-2017 11:01
0
10.7K
Kutip
5
Balasan
Guest
Tulis komentar menarik atau mention replykgpt untuk ngobrol seru
Mari bergabung, dapatkan informasi dan teman baru!
Website, Webmaster, Webdeveloper
23.3KThread•4.4KAnggota
Terlama
Guest
Tulis komentar menarik atau mention replykgpt untuk ngobrol seru