IBM разработала чип искусственного интеллекта с внутренним хранилищем данных, значительно превосходящий ускорители Nvidia

Новости о мире нейросетей и ИИ
IBM объявила о завершении тестирования нового процессорного прототипа для задач искусственного интеллекта. Новое разработка под кодовым названием NorthPole оказалась в 4 000 раз более эффективной, чем предыдущая архитектура искусственного интеллекта TrueNorth, и «сверхвпечатляюще» опередила все самые передовые центральные и графические процессоры.

Процессор NorthPole изготовлен с использованием 12-нм технологии и содержит 22 миллиарда транзисторов на площади 800 мм². Этот процессор содержит 256 ядер с обширным интерфейсом и встроенной памятью. Благодаря встроенной памяти чипа удалось достичь лучшей в отрасли энергоэффективности, сниженной задержки и эффективной площади. В один такт процессор NorthPole выполняет 2048 операций на каждое ядро (с точностью 8 бит). Для точности 4 и 2 бита количество операций удваивается и учетверяется соответственно. Эта способность призвана в первую очередь для обработки изображений, а именно для цифрового машинного зрения, используемого в автопилотах, автохирургии и т. д. IBM преодолела узкое место архитектуры фон Неймана, храня все данные внутри процессора, без отправки их на внешние носители данных. Тестирование на модели ResNet50, 50-слойной нейронной сети для тестирования решений по распознаванию и классификации изображений, показало, что энергоэффективность чипа NorthPole в 25 раз выше, чем у обычных GPU с технологией 12 нм и CPU с технологией 14 нм. Также показатели задержки были в 22 раза лучше. В конечном итоге архитектура IBM также опередила всех конкурентов по использованию площади чипа (количеству транзисторов), включая даже GPU с технологией 4 нм.