Pertanyaan Apa yang disebut dengan pemanggilan () beberapa kali pada model yang sama?


Setelah saya instantiate model scikit (mis. LinearRegression), jika saya menyebutnya fit() metode beberapa kali (dengan berbeda X dan y data), apa yang terjadi? Apakah itu cocok dengan model pada data seperti jika saya hanya instantiate model (yaitu dari awal), atau apakah itu menyimpan data akun yang sudah dipasang dari panggilan sebelumnya ke fit()?

Mencoba dengan LinearRegression (juga melihat kode sumbernya) tampaknya bagi saya bahwa setiap kali saya menelepon fit(), itu cocok dari awal, mengabaikan hasil dari panggilan sebelumnya ke metode yang sama. Saya bertanya-tanya apakah ini benar secara umum, dan saya dapat mengandalkan perilaku ini untuk semua model / saluran dari scikit belajar.


4
2018-04-15 11:19


asal


Jawaban:


Jika Anda akan mengeksekusi model.fit(X_train, y_train) untuk kedua kalinya - ini akan menimpa semua koefisien, bobot, intercept (bias) yang sebelumnya dipasang, dll.

Jika Anda ingin menyesuaikan hanya sebagian dari kumpulan data Anda dan kemudian meningkatkan model Anda dengan memasang data baru, maka Anda dapat menggunakannya penaksir, mendukung "Pembelajaran tambahan" (mereka, yang mengimplementasikan partial_fit() metode)


7
2018-04-15 11:24



Anda bisa menggunakan istilah cocok() dan melatih() kata secara bergantian dalam pembelajaran mesin. Berdasarkan model klasifikasi yang telah Anda instantiate, mungkin a clf = GBNaiveBayes() atau clf = SVC(), model Anda menggunakan teknik pembelajaran mesin yang ditentukan.
Dan begitu Anda menelepon clf.fit(features_train, label_train) model Anda memulai pelatihan menggunakan fitur dan label yang telah Anda lewati.

Kamu dapat memakai clf.predict(features_test) untuk memprediksi.
Jika Anda akan menelepon lagi clf.fit(features_train2, label_train2) itu akan mulai berlatih lagi menggunakan data yang dilewati dan akan menghapus hasil sebelumnya. Model Anda akan ulang model di dalam berikut:

  • Bobot
  • Fitted Coefficients
  • Bias
  • Dan hal-hal terkait pelatihan lainnya ...

Kamu dapat memakai partial_fit () metode juga jika Anda ingin barang-barang yang dihitung sebelumnya untuk tinggal dan juga melatih menggunakan data berikutnya


2
2018-04-15 11:50