Apa perbedaan antara informatika dan ilmu data?


Jawaban 1:

Informatika, dalam hal komputasi statistik, adalah studi tentang informasi (dalam bentuk apa pun) menggunakan algoritma yang bersifat matematis dan statistik. Ini tidak benar-benar digunakan sebagai kata dalam pengertian ini - yang paling dekat yang dapat saya pikirkan adalah bioinformatika. Nama yang lebih standar untuk ini adalah teori belajar.

Informatika, dalam ilmu komputer, adalah studi teoritis tentang informasi, algoritma, dan komputasi.

Jelas, kedua hal ini penting untuk diingat dalam aplikasi ilmu data apa pun, yang masih sangat tidak jelas, tetapi umumnya disepakati sebagai gabungan antara statistik, pemrograman, pengetahuan teoretis dan terapan (biasanya bisnis), matematika, dan keseluruhan sejumlah hal lainnya. Salah satu definisi paling tepat dari seorang ilmuwan data yang saya tahu masih orang yang tahu lebih banyak statistik daripada seorang programmer dan lebih banyak pemrograman daripada ahli statistik ... yang dengan sendirinya, sebagai definisi, sangat samar-samar.

Jika kita dapat setuju, paling tidak, bahwa apa yang dilakukan oleh seorang ilmuwan data adalah menyelesaikan masalah dengan data, maka definisi pertama dari informatika berada di dalam ranah sebagian besar ilmu data, sedangkan yang kedua penting untuk diingat (terutama untuk seseorang siapa yang sangat teliti).


Jawaban 2:

Di bawah ini adalah jawaban saya untuk pertanyaan: Apa perbedaan antara informatika dan ilmu data?

25 TOP TIPS UNTUK MENJADI ILMU DATA PRO!

Hai teman-teman, saya telah bekerja di sebuah perusahaan pemburu kepala sejak 2014, bidang utama dalam ilmu data, AI, pembelajaran mendalam…. Biarkan saya berbagi tips luar biasa untuk menjadi ilmuwan, atau ilmuwan seperti di bawah ini. Saya harap kamu menyukainya. (ref dari kdnuggets).

1. Memanfaatkan sumber datta eksternal: tweet tentang perusahaan Anda atau pesaing Anda, atau datta dari vendor Anda (misalnya, statistik eBlast buletin yang dapat disesuaikan tersedia melalui dashboard vendor, atau dengan mengirimkan tiket)

2. Fisikawan nuklir, insinyur mesin, dan pakar bioinformatika dapat menjadi ilmuwan datta hebat.

3. Nyatakan masalah Anda dengan benar, dan gunakan metrik suara untuk mengukur hasil (melebihi baseline) yang disediakan oleh inisiatif sains datta.

4. Gunakan KPI yang tepat (metrik kunci) dan datta kanan dari awal, dalam proyek apa pun. Perubahan karena fondasi yang buruk sangat mahal. Ini membutuhkan analisis yang cermat terhadap daata Anda untuk membuat daatabases yang berguna.

5. Ref sumber daya ini: 74 rahasia untuk menjadi ilmuwan data pro

6. Dengan daata besar, sinyal kuat (ekstrem) biasanya akan berisik. Inilah solusinya.

7. Data besar, nilai lebih kecil dari nilai yang berguna, a.

8. Gunakan dat besar, dari vendor pihak ketiga, untuk intelijen kompetitif.

9. Anda dapat membangun alat yang murah, bagus, terukur, dan kuat dengan cukup cepat, tanpa menggunakan ilmu statistik kuno. Pikirkan tentang teknik bebas model.

10. Data besar, lebih mudah dan lebih murah daripada yang Anda pikirkan. Dapatkan alat yang tepat! Inilah cara memulai.

11. Korelasi bukan sebab-akibat. Artikel ini mungkin membantu Anda dengan masalah ini. Baca juga blog ini dan buku ini.

12. Anda tidak perlu menyimpan semua data Anda, secara permanen. Gunakan teknik kompresi cerdas, dan simpan ringkasan statistik saja, untuk dat lama, a.

13. Jangan lupa untuk menyesuaikan metrik Anda ketika perubahan, untuk menjaga konsistensi untuk tujuan tren.

14. Banyak yang bisa dilakukan tanpa da, tabases, terutama untuk da besar, ta.

15. Selalu sertakan EDA dan DOE (analisis eksplorasi / desain eksperimen) sejak awal dalam proyek ilmu pengetahuan apa pun. Selalu buat kamus da, ta. Dan ikuti siklus hidup tradisional proyek ilmu pengetahuan apa pun.

16. Da, ta dapat digunakan untuk banyak tujuan:

- kualitas asuransi

- untuk menemukan pola yang dapat ditindaklanjuti (perdagangan saham, deteksi penipuan)

- untuk dijual kembali ke klien bisnis Anda

- untuk mengoptimalkan keputusan dan proses (riset operasi)

- untuk investigasi dan penemuan (IRS, litigasi, deteksi penipuan, analisis penyebab utama)

- komunikasi mesin-ke-mesin (sistem penawaran otomatis, mengemudi otomatis)

- prediksi (perkiraan penjualan, pertumbuhan, dan prediksi keuangan, cuaca)

17. Jangan buang Excel. Merangkul analitik cahaya. Da, ta + model + firasat + intuisi adalah perpaduan yang sempurna. Jangan menghapus salah satu dari bahan-bahan ini dalam proses pengambilan keputusan Anda.

18. Memanfaatkan kekuatan metrik gabungan: KPI yang berasal dari da, bidang tabase, yang memiliki daya prediksi jauh lebih baik daripada metrik basis data d asli. Misalnya, tabase, tabase Anda mungkin menyertakan bidang kata kunci tunggal tetapi tidak membedakan antara kueri pengguna dan kategori pencarian (kadang-kadang karena d, ata berasal dari berbagai sumber dan dicampur bersama). Deteksi masalah, dan buat metrik baru yang disebut jenis kata kunci - atau d, ata sumber. Contoh lain adalah kategori alamat IP, metrik dasar yang harus dibuat dan ditambahkan ke semua proyek analitik digital.

19. Kapan Anda membutuhkan pemrosesan waktu nyata yang sebenarnya? Ketika deteksi penipuan sangat penting, atau ketika memproses transaksi sensitif, ata (deteksi penipuan kartu kredit, 911 panggilan). Selain itu, analitik tertunda (dengan latensi beberapa detik hingga 24 jam) cukup baik.

20. Pastikan sensitif Anda, ata dilindungi dengan baik. Pastikan algoritme Anda tidak dapat dirusak oleh peretas kriminal atau peretas bisnis (memata-matai bisnis Anda dan mencuri semua yang mereka bisa, secara legal atau ilegal, dan membahayakan algoritme Anda - yang diterjemahkan dalam kehilangan pendapatan yang parah). Contoh peretasan bisnis dapat ditemukan di bagian 3 dalam artikel ini.

21. Padukan beberapa model bersama untuk mendeteksi berbagai jenis pola. Rata-rata model ini. Berikut adalah contoh sederhana dari pencampuran model.

22. Ajukan pertanyaan yang benar sebelum membeli perangkat lunak.

23. Jalankan simulasi Monte-Carlo sebelum memilih di antara dua skenario.

24. Gunakan beberapa sumber untuk d, ata yang sama: sumber internal Anda, dan d, ata dari satu atau dua vendor. Pahami perbedaan antara berbagai sumber ini, untuk memiliki gagasan yang lebih baik tentang bilangan real yang seharusnya. Terkadang perbedaan besar terjadi ketika definisi metrik diubah oleh salah satu vendor atau diubah secara internal, atau data telah berubah (beberapa bidang tidak lagi dilacak). Contoh klasik adalah data lalu lintas web: gunakan file log internal, Google Analytics, dan vendor lain (misalnya Accenture) untuk melacak data ini.

25. Pengiriman cepat lebih baik daripada akurasi ekstrim. Semua set data tetap kotor. Temukan kompromi sempurna antara kesempurnaan dan pengembalian cepat.