Loihi 2 untuk Komputasi Neuromorfik

Kami telah mengawasi upaya Neuromorphic Intel sejak meluncurkan silikon 14nm khusus pertama untuk Neuromorphic Computing, yang disebut Loihi, kembali di awal 2018. Dalam sebuah wawancara dengan Direktur Intel Lab Dr. Richard Uhlig kembali pada Maret 2021, saya bertanya tentang pengembangan perangkat keras, dan kapan kita mungkin melihat generasi kedua. Hari ini adalah hari itu, dan grup tersebut mengumumkan Loihi 2, peningkatan substansial dari generasi pertama yang membahas banyak buah gantung rendah dari desain pertama. Yang mungkin sama menariknya adalah node proses yang digunakan: Intel mengkomunikasikan bahwa Loihi 2 sedang dibangun, dalam silikon hari ini, menggunakan versi pra-produksi dari node proses EUV pertama Intel, Intel 4.

Komputasi Neuromorfik untuk Intel

Dengan menciptakan arsitektur yang pada intinya dimodelkan seperti otak, idenya adalah bahwa memiliki jutaan neuron dan sinapsis akan mengarah pada tugas komputasi dengan manfaat kekuatan/kinerja unik dalam tugas-tugas spesifik yang dirancang untuk dilakukan oleh otak. Ini adalah produk komersial potensial jangka panjang untuk Intel, namun tugas tim adalah mengembangkan teknologi dan perangkat lunak untuk menemukan dan mempercepat tugas yang cocok untuk komputasi tipe neuron.

Neuromorphic Lab di Intel sebenarnya melakukan akuisisi Fulcrum Microsystems pada tahun 2011. Pada saat itu, tim Fulcrum adalah kelompok komputasi asinkron yang bekerja pada switch jaringan. Teknologi itu dipindahkan ke grup jaringan di dalam Intel, dan divisi penelitian mengalihkan perhatiannya ke penggunaan komputasi asinkron lainnya, dan mendarat di Neuromorphic.

Pada saat itu, penelitian tentang arsitektur komputasi neuromorfik semacam ini untuk beban kerja aktual cukup baru – sementara bidangnya sudah ada. sejak akhir 1980-an, perangkat keras khusus yang dibuat untuk penelitian tidak benar-benar ada hingga awal 2010-an. NS Proyek Otak Manusia, sebuah proyek penelitian 10 tahun yang didanai oleh Uni Eropa untuk meneliti bidang ini, baru didirikan pada tahun 2013, dan di antaranya adalah SpinNaker sistem pada tahun 2019, dengan satu juta chip, satu miliar neuron, untuk 100 kW daya aktif.

Sebagai perbandingan, Loihi generasi pertama Intel mendukung 131000 neuron per 60 mm2 chip, dan 768 chip dapat disatukan dalam satu sistem Pohoiki Springs dengan 100 juta neuron hanya dengan 300 watt. Dalam pemasaran Intel sendiri, mereka menggambarkan ini sebagai setara dengan hamster. Chip Loihi 2 baru, pada level tinggi, menggunakan 31 mm2 per chip untuk satu juta neuron, secara efektif meningkatkan kepadatan 15x, namun perkembangannya melampaui angka mentah.

Loihi 2

Chip Loihi 2 pada tingkat tinggi mungkin terlihat serupa: 128 inti neuromorfik, tetapi sekarang setiap inti memiliki 8x lebih banyak neuron dan sinapsis. Masing-masing dari 128 core tersebut memiliki memori fleksibel 192 KB, dibandingkan dengan sebelumnya di mana ia ditetapkan per core saat runtime, dan setiap neuron dapat dialokasikan hingga 4096 status tergantung pada model, sedangkan batas sebelumnya hanya 24. Model Neuron juga sekarang dapat sepenuhnya diprogram, mirip dengan FPGA, memungkinkan fleksibilitas yang lebih besar.

Secara tradisional neuron dan jaringan berduri mengirimkan data dalam peristiwa biner, yang dilakukan oleh Loihi v1. Dengan Loihi 2, peristiwa tersebut dapat dinilai dengan payload 32-bit, menawarkan fleksibilitas yang lebih dalam untuk komputasi on-chip. Peristiwa tersebut sekarang dapat dipantau secara real time dengan fitur pengembangan/debug baru pada chip, daripada jeda/baca/putar. Dalam kombinasi, ini juga memungkinkan kontrol yang lebih baik saat mengubah beban kerja komputasi secara dinamis, seperti kompresi fan-out, penskalaan bobot, konvolusi, dan siaran.

Mungkin salah satu peningkatan terbesar adalah dalam konektivitas. Generasi pertama menggunakan protokol asinkron khusus untuk membuat jaringan neuron 2D yang besar, sementara Loihi 2 dapat dikonfigurasi untuk menggunakan berbagai protokol berdasarkan kebutuhan, tetapi juga dalam jaringan 3D. Kami diberitahu bahwa Loihi 2 bukan hanya satu chip, tetapi akan menjadi keluarga chip dengan arsitektur neuron yang sama tetapi berbagai pilihan konektivitas yang berbeda berdasarkan kasus penggunaan tertentu. Ini dapat digunakan bersama dengan akselerator kompresi pesan onboard untuk mendapatkan peningkatan 10x efektif dalam bandwidth chip-ke-chip.

Ini juga meluas ke konektivitas Loihi eksternal ke komputasi yang lebih konvensional, yang sebelumnya dimediasi FPGA – sekarang Loihi 2 mendukung Ethernet 10G, GPIO, dan SPI. Ini akan memungkinkan integrasi yang lebih mudah tanpa memerlukan sistem kustom, seperti membuat kluster komputasi Loihi 2 terpilah.

Dibangun pada Intel 4

Kami terkejut mendengar bahwa Loihi 2 dibangun di atas versi pra-produksi dari proses Intel 4. Kami masih jauh dari Loihi 2 menjadi bagian dari pendapatan Intel, dan tim Neuromorphic tahu banyak, tetapi ternyata chip mungkin merupakan kandidat yang ideal untuk membantu memunculkan proses baru.

Pada 31 mm2, ukurannya berarti bahwa meskipun hasil perlu ditingkatkan, satu wafer dapat menawarkan lebih banyak chip yang berfungsi daripada pengujian dengan ukuran die yang lebih besar. Saat tim melakukan pengujian pasca-silikon untuk voltase/frekuensi/fungsi, mereka dapat kembali lebih cepat ke tim Pengembangan Teknologi Intel. Kami mengkonfirmasi bahwa ada silikon sebenarnya di lab, dan kenyataannya perangkat keras akan tersedia hari ini melalui Intel’s DevCloud, langsung ke logam, tanpa emulasi apa pun.

Biasanya dengan node proses baru, Anda memerlukan pelanggan dengan ukuran die silikon kecil untuk membantu beralih melalui hambatan potensial dalam membawa proses ke ramp dan produksi skala penuh. Pesaing pengecoran Intel biasanya melakukan ini dengan pelanggan yang memiliki chip berukuran smartphone, dan manfaat bagi pelanggan biasanya berarti pertama untuk perangkat keras atau mungkin semacam diskon awal (walaupun, mungkin tidak dalam iklim saat ini). Intel sebelumnya telah berjuang di bagian depan itu, karena hanya memiliki silikon sendiri untuk digunakan sebagai kendaraan uji.

Tim Neuromorphic mengatakan bahwa itu sebenarnya cocok, mengingat perangkat keras neuromorphic membutuhkan kepadatan tinggi dan daya statis rendah yang diberikan oleh node proses terdepan. Desain 128-inti juga berarti memiliki unit berulang yang konsisten, memungkinkan tim proses untuk melihat keteraturan dan konsistensi dalam produksi. Juga, mengingat bahwa Loihi masih menjadi proyek penelitian untuk saat ini, tidak ada harapan serius untuk mendorong produk itu ke pasar di jendela tertentu, yang mungkin dibutuhkan oleh pelanggan besar.

Apakah ini berarti Intel 4 siap diproduksi? Tidak cukup, tetapi itu menunjukkan bahwa kemajuan sedang dibuat. Sejumlah tolok ukur Loihi 2 yang terdaftar memang memiliki peringatan ‘hasil perangkat keras simulasi yang diharapkan’, meskipun beberapa lainnya dilakukan pada silikon asli, dan perusahaan mengatakan memiliki silikon nyata untuk digunakan di cloud hari ini. Intel 4 adalah node proses pertama Intel yang menggunakan litografi Extreme Ultra Violet (EUV), dan Intel akan menjadi produsen semi besar terakhir yang memulai proses EUV untuk produksi. Tapi kita masih jauh – kembali ke Intel Dipercepat Namun, EUV dan Intel 4 diperkirakan tidak akan meningkatkan produksi hingga paruh kedua tahun 2022.

Sebagai penutup, dari pengumuman Intel, kita dapat melihat kepadatan transistor. Pada 2,3 miliar transistor dalam 31 mm2, yang akan menempatkan kepadatan pada 71,2 juta per mm2, yang hanya sepertiga dari apa yang kami harapkan. Perkiraan berdasarkan pengumuman Intel sebelumnya akan menempatkan Intel 4 di sekitar 200 MTr/mm2. Jadi mengapa Loihi 2 sangat rendah dibandingkan dengan angka itu?

Pertama mungkin itu adalah chip neuromorfik, dan bukan desain logika tradisional. Inti memiliki ~25 MB total SRAM bersama dengan semua logika, yang untuk 31mm2 chip mungkin merupakan bagian yang bagus dari area die. Juga, ide utama Intel dengan chip neuromorfik adalah fungsionalitas pertama, kinerja kedua, dan kekuatan ketiga. Jadi membuatnya bekerja dengan benar lebih penting daripada membuatnya bekerja dengan cepat, jadi tidak selalu ada kebutuhan mentah untuk kepadatan tertinggi. Lalu ada fakta bahwa itu masih merupakan chip pengembangan, dan memungkinkan Intel untuk menyempurnakan proses EUV dan menguji litografi presisi tanpa harus terlalu khawatir tentang cacat yang disebabkan oleh perpustakaan transistor yang padat. Lebih banyak lagi yang akan datang, saya yakin.

Untuk menambahkan poin terakhir, pengarahan kami berspekulasi bahwa IP neuromorfik berpotensi tersedia melalui penawaran IP Layanan Foundry Intel di masa mendatang.

Kerangka Perangkat Lunak Lava Baru

Terlepas dari kemampuan pemrosesan, salah satu blok bangunan utama untuk sistem Neuromorphic adalah jenis komputasi, dan mungkin betapa sulitnya menulis perangkat lunak untuk memanfaatkan arsitektur semacam itu. Dalam diskusi dengan Mike Davies dari Intel, Direktur Intel Neuromorphic Lab, kami menjelaskan bahwa komputasi modern mirip dengan arsitektur polling – setiap siklus membutuhkan data dan memprosesnya. Sebaliknya, komputasi Neuromorphic adalah arsitektur berbasis interupsi – ia bertindak ketika data siap. Komputasi neuromorfik lebih bergantung pada domain waktu daripada komputasi modern, sehingga baik konsep komputasi maupun aplikasi yang dapat dikerjakannya hampir ortogonal dengan teknik komputasi tradisional. Misalnya, meskipun pembelajaran mesin dapat diterapkan ke komputasi neuromorfik dalam bentuk Spiking Neural Networks (SNN), pustaka PyTorch dan TensorFlow tradisional tidak dibuat untuk mengaktifkan SNN.

Hari ini, sebagai bagian dari pengumuman, Intel meluncurkan kerangka kerja perangkat lunak baru yang mendasari untuk komunitas neuromorfik yang disebut Lava. Ini adalah kerangka kerja sumber terbuka, tidak di bawah kendali Intel, tetapi oleh komunitas. Intel telah mendorong sejumlah alat awalnya sebagai bagian dari kerangka kerja, dan idenya adalah bahwa seiring waktu, tumpukan perangkat lunak lengkap dapat dikembangkan untuk semua orang yang terlibat dalam komputasi Neuromorphic untuk digunakan, terlepas dari perangkat kerasnya (CPU, GPU, chip Neuromorphic) . Lava dirancang untuk menjadi modular, composable, extensible, hierarkis, dan open-source. Ini termasuk antarmuka tingkat rendah untuk memetakan jaringan saraf ke perangkat keras neuromorfik, penyampaian pesan asinkron berbasis saluran, dan semua pustaka dan fitur diekspos melalui Python. Perangkat lunak ini akan tersedia untuk penggunaan gratis di bawah BSD-3 dan LGPL-2.1 di GitHub.

Sistem Awal

Versi pertama Loihi 2 yang digunakan di layanan cloud Intel adalah Oheo Gulch, yang terlihat seperti kartu tambahan PCIe menggunakan FPGA untuk mengelola banyak IO, bersama dengan konektor backplane jika diperlukan. 31 mm2 chip adalah BGA, dan di sini kita melihat salah satu konektor internal Intel untuk menahan chip BGA ke papan pengembangan.

Di masa mendatang, Intel akan memproduksi versi 4 inci kali 4 inci yang disebut Kapoho Point, dengan delapan chip terpasang, yang dirancang untuk ditumpuk dan diintegrasikan ke dalam mesin yang lebih besar.

Dengan memiliki chip sekecil itu, saya bertanya-tanya apakah tidak ada gunanya membangunnya dengan pengontrol USB pada silikon, atau memiliki antarmuka USB-ke-Ethernet, dan menawarkan perangkat keras pada stik USB, mirip dengan apa yang dulu didistribusikan oleh Intel Movidius . Kami bertanya kepada Intel tentang memperluas penggunaan Loihi 2 ke audiens non-penelitian/non-komersial yang lebih luas untuk bermain-main dan homebrew, namun karena ini masih merupakan proyek Intel Labs saat ini, salah satu elemen kunci untuk tim adalah kolaborasi khusus yang mereka miliki dengan mitra untuk mendorong segmen ke depan. Jadi kita harus menunggu setidaknya generasi lain atau lebih untuk melihat apakah ada sistem Loihi di masa depan yang akhirnya ditawarkan di Amazon.

Loihi 2 harus tersedia bagi mitra penelitian untuk digunakan mulai hari ini sebagai bagian dari Intel’s DevCloud. Penyebaran penelitian/kolaborasi di tempat diharapkan selama 12-24 bulan ke depan.

Bacaan Terkait

We will be happy to hear your thoughts

Leave a reply

Deteksimalut