# Hello, World of Machine Learning

## 1. Sebelum memulai

Pada Jupyter Notebook ini, kamu akan mempelajari dasar "Hello, World" pada machine learning, dimana alih-alih kamu memprogram secara eksplisit aturan-aturan pada suatu bahasa pemrograman, seperti C++ atau Java, kamu akan membangun sistem yang dilatih menggunakan data untuk memprediksi aturan-aturan yang menggambarkan keterkaitan antara data.

Bayangkan masalah ini: Kamu membangun sistem fitness tracking yang bisa mengenali aktifitas-aktifitas olahraga. Kamu mungkin memiliki akses ke data kecepatan jalan seseorang dan mencoba untuk memprediksi aktifitas orang tersebut berdasarkan kecepatannya menggunakan kondisi.

![person walking](../images/hello_ml/hello_ml_person_walking.png)

```python
if speed < 4:
    status = walking
```

Kamu selanjutnya bisa menambah kondisi untuk lari:

![person running](../images/hello_ml/hello_ml_person_running.png)

```python
if speed < 4:
    status = WALKING
else:
    status = RUNNING
```

Kamu juga bisa menambahkan kondisi akhir untuk bersepeda:

![person cycling](../images/hello_ml/hello_ml_person_cycling.png)

```python
if speed < 4:
    status = WALKING
if speed < 12:
    status = RUNNING
else:
    status = CYCLING
```

Sekarang, coba pertimbangkan apa yang akan terjadi selanjutnya jika kamu mau menambahkan suatu aktifitas baru, misalnya golf. Tentu akan jauh lebih ambigu untuk menentukan aturan untuk aktifitas tersebut.

![person golfing](../images/hello_ml/hello_ml_person_golfing.png)

```python
# Selanjutnya gimana?
```

Sangatlah sulit untuk menulis program yang bisa mengenali aktifitas bermain golf, jadi apa yang harus kamu lakukan? Gunakan machine learning!

## Prasyarat

Sebelum mencoba Jupyter Notebook ini, kamu perlu memiliki:

1. Pengetahuan yang solid tentang Python
2. Keterampilan pemrograman dasar

## Yang akan kamu pelajari

1. Dasar-dasar machine learning

## Yang akan kamu buat

1. Model machine learning pertama kamu

## 2. Apa itu Machine Learning?

Mari kita lihat cara tradisional membangun suatu aplikasi yang direpresentasikan oleh diagram di bawah:

![traditional programming diagram](../images/hello_ml/hello_ml_traditional_programming.png)

Kamu mengekpresikan aturan-autran menggunakan sebuah bahasa pemrograman. Aturan-aturan tersebut bereaksi terhadap data dan program kamu akan memberikan jawaban. Pada kasus deteksi aktifitas olahraga, aturan-aturan (kode yang kamu tulis untuk mendefinisikan tipe-tipe aktifitas) bereaksi terhadap data yang masuk (kecepatan gerak pengguna) untuk menghasilkan jawaban: yaitu output nilai dari fungsi untuk mendeteksi status aktifitas pengguna.

Proses mendeteksi status aktifitas menggunakan ML sebenernya lumayan mirip, hanya input dan outputnya saja yang berbeda:

![ml flow diagram](../images/hello_ml/hello_ml_ml_flow_diagram.png)

Daripada mencoba mendefiniskan aturan-aturan dan mengkespresikannya di dalam sebuah bahasa pemrograman, kamu memberikan jawaban-jawaban (biasanya disebut labels) bersamaan dengan data yang ada, dan selanjutnya mesin akan menyimpulkan aturan-aturan yang menentukan hubungan antara jawaban dan data. Sebagai contohnya, deteksi aktifitas olahraga mungkin akan terlihat seperti ini dalam konteks ML:

![dataset representation](../images/hello_ml/hello_ml_dataset_representation.png)

Kamu mengumpulkan data dan label yang sangat banyak sehingga bisa dengan efektif bilang, "Kalo jalan tuh gini loh," atau "Kalo lari tuh gini loh." Selanjutnya, dari dataset tersebut komputer bisa menyimpulkan aturan-aturan yang menentukan pola-pola yang menjelaskan aktifitas tertentu.

Bukan hanya menjadi metode alternatif dari pemrograman, metode ini juga memberikan kemampuan baru untuk skenario-skenario baru, misalnya menentukan pola-pola kegiatan bermain golf yang tidak mungkin dilakukan dengan pemrograman tradisional.

Dalam pemrograman tradisional, kode kamu terkompilasi menjadi sebuah binary yang biasanya disebut sebagai program. Pada ML, output yang kamu bangun dari data dan labels disebut **model**.

Jadi, jika kita kembali lagi ke diagram ini:

![ml flow diagram](../images/hello_ml/hello_ml_ml_flow_diagram.png)

Output dari diagram flow di atas adalah model, dan kita bisa menggunakannya sebagai berikut:

![using ml model](../images/hello_ml/hello_ml_using_ml_model.png)

Dimana kamu memberikan data sebagai input dan model menggunakan aturan-aturan yang disimpulakn dari proses pembelajaran mesin untuk menghasilkan prediction, misalnya, "Data ini terlihat seperti orang berjalan" atau "Data ini terlihat seperti orang bersepeda."

## 3. Membuat ML model pertama kamu

Perhatikan deretan-deretan angka di bawah. Apakah kam bisa melihat hubungan antara mereka?

X | Y
--|--
-1|-2
0|1
1|4
2|7
3|10
4|13

Kamu mungkin sadar bahwa nilai X bertambah 1 setiap barisnya dan nilai Y bertambah 3. Kamu mungkin berpikir bahwa Y sama dengan 3X ditambah atau dikurangi suatu angka. Selanjutnya kamu melihat ketika X=0 dan Y=1, kamu akan menyimpulkan bahwa Y=3X+1.

Yang baru saja kamu lakukan mirip persis dengan bagaimana kamu melatih ML model untuk melihat pola pada data!

Sekarang, ayoi kita lihat kode untuk melakukannya.

Bagaimana kamu melatih sebuah neural network untuk melakukan task serupa? Dengan menggunakan data! Kita harus memberikan data himpunan X dan Y kepada neural network sehingga ia mampu mengenali hubungan antara himpunan X dan Y.

### Import

Mulai dengan meng-import library yang dibutuhkan. Kamu akan menggunakan TensorFlow dan memberi alias `tf` agar lebih mudah digunakan.

Selanjutnya, import `numpy` untuk merepresentasikan data sebagai lists secara mudah dan cepat.

Terakhir, kita akan menggunakan `keras`, sebuah framework untuk membuat neural network sebagai kumpulan layer-layer berurutan

In [1]:
import numpy as np
import tensorflow as tf
from tensorflow import keras

### Menentukan dan mengkompilasi jaringan neural

Selanjutnya, kita akan membuat neural network sederhana. Neural networknya hanya memiliki satu layer, layer tersebut hanya memiliki satu neuron, dan input shape nya hanya satu.

In [3]:
model = tf.keras.Sequential([keras.layers.Dense(units=1, input_shape=[1])])
model.summary()

Selanjutnya, kita akan menulis kode untuk mengkompilasi neural network kita. Untuk melakukannya, kamu perlu membuat dua funsi-- fungi `loss` dan `optimizer`.

Pada contoh kali ini, kamu telah mengetahui bahwa hubungan antara angka-angka di atas adalah Y=3X+1.

Namun, ketika komputer mencoba untuk mempelajari hal ini, komputer akan mencoba membuat tebakan, bisa jadi tebakan pertamanya adalah Y=10X+10. Fungsi `loss` digunakan untuk mengukur jarak antara hasil perhitungan menggunakan fungsi tebakan dengan jawaban sesungguhnya, apakah bagus atau buruk.

Selanjutnya, model akan menggunakan fungsi `optimizer` untuk membuat tebakan selanjutnya. Berdasarkan hasil dari fungsi `loss`, fungsi `optimizer` akan mencoba meminimalisir nilai loss. Pada titik ini, komputer mungkin akan menebak menggunakan Y=5X+5. Walaupun tebakannya masih jelek, tapi komputer sudah mendekati ke jawaban yang benar (karena nilai loss nya mengecil).

Nah, model mengulangi hal di atas terus menerus sampai batas `epochs`, dimana akan kamu lihat sebentar lagi.

Pertama-tama, kita akan menggunakan fungsi `mean_squared_error` untuk fungsi loss dan stochastic gradient descent (`sgd`) untuk fungsi optimizer. Kamu belum perlu tahu rumus matematika dibalik layar fungsi-fungsi tersebut, tetapi kamu bisa melihat kalau mereka ampuh!

Seiring berjalannya waktu, kamu akan belajar berbagai macam fungsi-fungsi yang bisa ditentukan untuk `loss` dan `optimizer` di skenario-skenario berbeda.

In [4]:
model.compile(optimizer="sgd", loss="mean_squared_error")

### Berikan data

Selanjutnya, kita akan memberikan data. Pada kasus kali ini, kita akan menggunakan enam angka X dan Y dari sebelumnya.

Kita akan menggunakan NumPy untuk membuat array:

In [5]:
xs = np.array([-1.0, 0.0, 1.0, 2.0, 3.0, 4.0], dtype=float)
ys = np.array([-2.0, 1.0, 4.0, 7.0, 10.0, 13.0], dtype=float)

Sekarang kamu sudah selesai menulis kode yang mendefiniskan sebuah neural network! Langkah selanjutnya adalah melakukan model training agar neural network kamu bisa menyimpulkan pola-pola antara angka-angka di atas dan menggunakannya untuk membuat model.

## 4. Train the neural network

Proses training neural network untuk mempelajari hubungan antara nilai-nilai X dan Y dapat dimulai dengan memanggil fungsi `model.fit`. Menggunakan fungsi ini, neural network akan berulang kali melakukan tebakan, mengukur berapa bagus tebakannya (nilai loss), atau menggunakan optimizer untuk membuat tebakan lain. Neural network akan melakukan perulangan (looping) sesuai dengan jumlah `epochs` yang kamu tentukan. Ketika kamu menjalankan fungsi `model.fit` kamu akan melihat nilai loss pada setiap epoch.

In [6]:
model.fit(xs, ys, epochs=500)

Epoch 1/500
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 87ms/step - loss: 14.2421
Epoch 2/500
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 9ms/step - loss: 11.2341
Epoch 3/500
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 9ms/step - loss: 8.8670
Epoch 4/500
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 9ms/step - loss: 7.0041
Epoch 5/500
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 8ms/step - loss: 5.5379
Epoch 6/500
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 10ms/step - loss: 4.3838
Epoch 7/500
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 9ms/step - loss: 3.4752
Epoch 8/500
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 9ms/step - loss: 2.7599
Epoch 9/500
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 11ms/step - loss: 2.1966
Epoch 10/500
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 11ms/step - loss: 1.7528
Epoch 11/500


<keras.src.callbacks.history.History at 0x14fd18770>

Yeay, proses training selesai!

Sebelum lanjut, ayo kita review lagi proses pembelajaran neural network kita.

Di awal epochs, kamu bisa melihat nilai loss yang begitu besar, tetapi terus mengecil seiring pengulangan selanjutnya. Ketika training selesai, nilai loss sangatlah kecil. Hal ini menunjukkan bahwa model kita memiliki performa yang sangat baik dalam menyimpulkan hubungan antara angka X dan Y.

Kamu mungkin sadar bahwa kamu tidak butuh 500 epochs dan kamu bisa mencoba bereksperimen dengan epochs berbeda. Seperti yang kamu lihat dari contoh di atas, nilai loss nya sudah sangat kecil setelah epochs ke-50!

## Menggunakan model

Kamu telah memiliki model yang telah di-training untuk mempelajari hubungan antara X dan Y. Kamu bisa menggunakan fungsi `model.predict` untuk mempredisksi nilai Y dari nilai X baru. Misalnya, jika nilai X nya adalah 10, berapakah nilai Y?

Coba kamu tebak sebelum menjalankan kode di bawah:

In [8]:
print(model.predict(np.array([10.0])))

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 10ms/step
[[31.006397]]


Kamu mungkin menebak jawabannya adalah 31, tapi hasil dari model sedikit berbeda. Mengapa begitu?

Neural network berurusan dengan probabilitas, sehingga neural network mengkalkulasio bahwa terdapat probabilitas yang sangat besar bahwa hubungan antara X dan Y adalah Y=3X+1, tapi dia tidak bisa menjawab dengan yakin hanya dengan menggunakan 6 data point. Hasilnya sangat dekat dengan 31, tapi belum tentu 31.

Semakin sering kamu menggunakan neural network, kamu akan semakin sering melihat pola seperti di atas terjadi. Kamu pasti akan selalu berurusan dengan probabilitas, bukan kepastian, dan akan melakukan sedikit coding untuk mnengetahui hasil berdasalkan probabilitas, terutama jika berurusan dengan klasifikasi.

## Selamat! 🎉

Percaya atau tidak, kamu telah mempelajari sebagian besar konsep ML yang dapat kamu gunakan dalam skenario yang lebih kompleks. Kamu telah mempelajari cara melatih neural network untuk mengetahui hubungan antara dua himpunan angka. Kamu telah membuat himpunan layers (walau dalam tutorial ini hanya satu lapisan) yang berisi neuron (juga dalam kasus ini, hanya satu), yang kemudian kamu kompilasi menggunakan fungsi `loss` dan `optimizer`.

Neural network, fungsi `loss`, dan fungsi `optimizer` dapat digunakan untuk proses menebak hubungan antara angka-angka, mengukur seberapa baik mereka melakukannya, lalu membuat parameter baru untuk tebakan baru. Begitulah cara kerja machine learning secara sederhananya.