https://www.openai.com/blog/triton/ - 파이썬과 비슷한 프로그래밍 언어 & 컴파일러 - CUDA 경험이 없는 연구자들도 쉽게 고효율의 딥러닝을 위한 GPU코드 작성가능 ㅤ→ 이미 Torch 구현 보다 2배정도 효율이 좋은 커널 구현 - Linux, NVIDIA GPU 지원 (AMD GPU 와 다른 CPU들은 개발중) - 기본 코드는 Numba와 비슷 하지만, SIMT를 사용하지 않고 블록단위에 대한 연산으로 인스턴스 내에서 병렬 실행 - 파이썬 코드를 Triton-IR로 바꾸고 Triton Compiler 를 통해서 LLVM-IR로 변환하는 아키텍처 음성 기능은 200자로 제한됨 |