Pertambangan Data

London Financial Studies

Deskripsi Program

Baca Keterangan Resminya

Pertambangan Data

London Financial Studies

Popularitas teknik sains data seperti penambangan data dan pembelajaran mesin telah berkembang pesat dalam beberapa tahun terakhir. Mereka menyajikan solusi efektif untuk memproses dan menganalisis sejumlah besar data yang tersedia untuk manajer risiko dan analis keuangan.

Dengan kemajuan dalam kekuatan komputasi dan pemrosesan terdistribusi, sekarang mungkin untuk memproses - dan memahami - banyaknya informasi yang dapat dikumpulkan dari beberapa sumber data yang berbeda.

Program hands-on ini mencakup teknik-teknik utama - termasuk beberapa aspek pembelajaran mesin yang diawasi dan tidak diawasi - yang dapat digunakan saat menambang data keuangan. Program ini juga berfokus pada teknik ilmu data tingkat lanjut yang menjadi banyak digunakan di pasar keuangan untuk analisis teks dan kecerdasan buatan: Natural Language Processing (NLP) dan Deep Learning (DL).

Program ini disampaikan sepenuhnya melalui lokakarya dan studi kasus. Peserta akan belajar bagaimana menerapkan teknik pemrosesan bahasa alami dengan membangun model analisis sentimen untuk menganalisis string teks. Di bagian pembelajaran mendalam, peserta akan fokus pada pembangunan dan pengujian jaringan saraf untuk memecahkan masalah keuangan dengan bantuan Python.

Kebanyakan latihan dan studi kasus diilustrasikan dengan Python, memungkinkan Anda untuk belajar bagaimana bekerja dengan bahasa pemrograman yang fleksibel ini.

Tanggal: 21 - 23 November 2018

Tempat: Central London

Biaya: £ 1325 per hari

Anda mungkin memenuhi syarat untuk tarif istimewa. Silakan hubungi kami untuk memeriksa apakah perusahaan Anda adalah anggota Program Klien Global LFS.


Untuk Siapa Kursus Ini

  • Manajer portofolio
  • Manajer risiko
  • Profesional yang ingin memperkenalkan konsep penambangan data dalam tugas sehari-hari mereka
  • Pengembang IT
  • Ahli statistik
  • Quant analis
  • Insinyur keuangan
  • Konsultan


Tujuan Pembelajaran

  • Bangun basis pengetahuan yang kuat tentang teknik dan alat penambangan data, serta aplikasi mereka ke industri keuangan
  • Dapatkan pengalaman langsung dengan Natural Language Processing dan Deep Learning di bidang keuangan
  • Pelajari cara menerapkan Python ke penambangan dan pemrosesan data, dan untuk menyelesaikan masalah NLP dan DL dunia nyata
  • Dapatkan pemahaman tentang algoritma Jaringan Saraf Tiruan (JST) dan bagaimana menggunakannya untuk merancang, membangun, dan mengembangkan model DL


Pengetahuan Sebelumnya

  • Dasar pengertian statistik
  • Pengetahuan tentang Excel yang baik
  • Tidak diperlukan pengetahuan Python sebelumnya


Garis besar kursus

Hari pertama

Tinjauan Data Mining

Meletakkan berbagai komponen penambangan data

  • Aturan asosiasi
  • Klasifikasi vs masalah regresi
  • Analisis Clustering

Visualisasi data

  • Gambaran solusi pihak ketiga (Tableau, QlikeTech, dll.) Untuk visualisasi kumpulan data besar. Studi kasus akan dikerjakan menggunakan matplotlib-library dan plotly (platform kolaborasi data online sumber-terbuka)
  • Database grafis: menerapkan teori jaringan ke analisis portofolio dan pengenalan ke database grafis
  • Deteksi outlier
  • Jarak Mahalanobis

Regresi

  • OLS (kuadrat terkecil biasa)
  • Regresi Ridge
  • Sparsity
  • Laso
  • Elastis Bersih

Workshop: Mengupayakan lindung nilai optimal dari portofolio ekuitas dunia nyata besar menggunakan futures. Portofolio memiliki sifat global (100 saham), tetapi hanya satu set berjangka terbatas yang tersedia

Analisis Komponen Utama (PCA)

  • Analisis komponen utama dari struktur jangka suku bunga dan volatilitas tersirat
  • Principal component regression (PCR)
  • Partial least squares (PLS)

Lokakarya: Menggunakan PCA untuk mengurangi dimensi dari kumpulan data besar kurva suku bunga historis. Perilaku kompleks kurva ini tersebar di berbagai kedewasaan dan teknik ini memungkinkan manajer risiko memiliki pandangan yang jauh lebih baik tentang dinamika kurva suku bunga

Klasifikasi Data - Regresi

Estimasi Kerapatan dan Klasifikasi Kernel

  • Kernel density estimation adalah prosedur pembelajaran yang tidak diawasi, yang mengarah ke keluarga sederhana prosedur untuk klasifikasi non-parametrik

Studi Kasus: Menggunakan kernel untuk mendapatkan distribusi probabilitas untuk data keuangan

Klasifikasi - Bagian I

  • Klasifikasi Naive Bayes: Teknik yang lugas dan kuat untuk mengklasifikasikan data

Studi Kasus: Mengerjakan prediktor Bayes untuk kumpulan data besar yang mengandung atribut berbeda dari bank-bank AS. Klasifikasi Bayes akan digunakan untuk memisahkan bank-bank yang cenderung gagal dari mereka yang akan tetap pelarut

Klasifikasi - Bagian II

  • Teknik penambangan data yang kuat
  • Regresi logistik

Studi Kasus: Menerapkan regresi log pada dataset dunia nyata dengan dimensi tinggi

Hari kedua

Klasifikasi Data (lanjutan)

Klasifikasi - Bagian III

  • Klasifikasi Pohon: CART-pemodelan mengarah ke pohon keputusan praktis yang mudah digunakan
  • Konsep pohon keputusan akan diperluas dengan teknik seperti Random Forest dan Bagging

Studi Kasus: Konsep seperti fungsi biaya, tingkat pengotor, pemangkasan pohon dan validasi silang akan ditangani secara terperinci

  • Pembelajaran K-Nearest Neighbor
  • Regresi logistik

Studi Kasus: Metode klasifikasi (K-Nearest and CART) akan bekerja pada indikator teknis yang berbeda (RSI, MACD, dll.) Dari set besar data keuangan dunia nyata. Ini akan mengilustrasikan bagaimana pengklasifikasi ini dapat digunakan untuk membagi stok dalam berbagai ember berbeda sesuai dengan kekuatan atribut yang berbeda dengan cara cepat

Workshop: Alat penambangan data

Pengantar Python - Bahasa pemrograman yang kuat

Penerapan Piton dalam domain analisis data akan diilustrasikan melalui contoh-contoh praktis dengan fokus pada pembelajaran mesin menggunakan paket 'scikit-learn'. Semua contoh akan dibahas di notebook Jupyter. Delegasi akan belajar cara membuat laporan khusus dengan Python

Hari ketiga

Pengolahan Bahasa Alami

Mengekstraksi nilai nyata dari posting media sosial, gambar, email, PDF dan sumber data tidak terstruktur lainnya adalah tantangan besar bagi perusahaan.

Bagian ini dikhususkan untuk aplikasi Natural Language Processing (NLP) untuk mengekstrak nilai dari data tidak terstruktur. Beberapa contoh nyata dari pengujian data tidak terstruktur dalam keuangan - termasuk analisis sentimen dari berita keuangan - akan dieksplorasi.

Workshop: Menggunakan paket NLTK Python untuk:

  • Jelajahi dan tokenize teks menggunakan Tf-Idf dan Count Vectors
  • Memprediksi kata-kata dalam teks: membangun prediktor kata mulai dari teks; menulis program yang dapat memprediksi kata yang mengikuti kata tertentu
  • Memahami sentimen item berita pada saham tertentu

Belajar di dalam

Deep Learning sebagai sub-bidang pembelajaran mesin - algoritma Jaringan Saraf Tiruan (JST).

  • Pengantar Pembelajaran Mendalam
  • Meneruskan propagasi
  • Pendekatan Word2vec
  • Jaringan yang lebih dalam dan propagasi ke depan
  • Mengoptimalkan Jaringan Syaraf dengan propagasi mundur

Studi Kasus: Membangun model Deep Learning dengan Python (dengan fokus pada paket Keras dan Tensorflow)

Sekolah ini menawarkan program di:
  • Inggris


Terakhir diperbarui August 9, 2018
Durasi & Harga
Kursus ini Berbasis Kampus
Start Date
Tanggal mulai
Apr. 10, 2019
Nov. 2019
Duration
Durasi
3 hari
Penuh waktu
Price
Harga
3,975 GBP
£ 1325 per hari
Information
Deadline
Locations
Britania Raya - London, Inggris
Tanggal mulai : Apr. 10, 2019
Tenggat waktu aplikasi Hubungi sekolah
Tanggal selesai Apr. 12, 2019
Tanggal mulai : Nov. 2019
Tenggat waktu aplikasi Hubungi sekolah
Tanggal selesai Hubungi sekolah
Dates
Apr. 10, 2019
Britania Raya - London, Inggris
Tenggat waktu aplikasi Hubungi sekolah
Tanggal selesai Apr. 12, 2019
Nov. 2019
Britania Raya - London, Inggris
Tenggat waktu aplikasi Hubungi sekolah
Tanggal selesai Hubungi sekolah
Video

LFS Webcast series - Applying Data-Mining in Finance