شتاب دهنده شبکه عصبی مبتنی بر FPGA از GPU بهتر عمل می کند
این با استفاده از وضوح عدد صحیح هشت بیتی به عنوان یک GoogLeNet Inception-v1 CNN نشان داده شد. این عملکرد 16.8 ترات در ثانیه (TOPS) به دست آورد و می تواند بیش از 5،300 تصویر در ثانیه در یک fpga Xilinx Virtex UltraScale + XCVU9P-3 استنباط کند. Fawcett توضیح داد: این رویکرد مدولار ، مقیاس پذیر ، آن را برای کاربردهای ردیابی و پردازش فیلم در لبه و ابر مناسب می کند ، Fawcett توضیح داد ، و همچنین برای استنتاج در مراکز داده و دوربین های هوشمند.
DPU می تواند پیکربندی شود تا عملکرد محاسباتی بهینه را برای توپولوژی های شبکه عصبی در برنامه های یادگیری ماشین با استفاده از معماری موازی DSP ، حافظه توزیع شده و تنظیم مجدد منطق و اتصال برای الگوریتم های مختلف تنظیم کند.
DPU ادعا می کند که شرکت DPU با بیش از 50٪ عملکرد بالاتر از هر CNN های رقیب و عملکردهای گرافیکی خارج از خانه را برای یک بودجه قدرت یا هزینه مشخص انجام می دهد. Fpcett افزود: "fpga یک سیستم عامل و معماری با ضرب و شتم در جهان است که برای تصحیح در آینده بسیار انعطاف پذیر است و می تواند GPU ها را در هوش مصنوعی با تأخیر کمتری پشت سر بگذارد."
این شرکت همچنین اعلام کرده است كه از DPhil (PhD0 در دانشگاه آكسفورد) حمایت می كند تا روشهای اجرای شتاب یادگیری عمیق را بر روی fpgas مطالعه كند.
