지능형 컴퓨팅을 움직이는 핵심 엔진
고성능 AI · HPC 응용을 효율적으로 구축하기 위한 Infrastructure를 경험하세요
지능형 컴퓨팅을 움직이는 핵심 엔진
고성능 AI · HPC 응용을 효율적으로 구축하기 위한 Infrastructure를 경험하세요
주요 기능
주요 기능
주요 기능 1
대규모 데이터의 실시간 처리를 위한 고속 행렬 연산자 지원
AI 및 HPC 응용을 위해 설계된 고성능 행렬 연산 프레임워크로, 이미지·신호 처리와 선형 대수 등 다양한 연산자를 최적화하여 오픈소스 대안 제품보다 뛰어난 성능을 제공합니다.
대규모 데이터에 대한 복잡한 계산을 실시간으로 처리하여 연산 집약적인 AI 및 HPC 환경에서도 안정적이고 빠른 성능을 보장합니다.
주요 기능 1
대규모 데이터의 실시간 처리를 위한 고속 행렬 연산자 지원
AI 및 HPC 응용을 위해 설계된 고성능 행렬 연산 프레임워크로, 이미지·신호 처리와 선형 대수 등 다양한 연산자를 최적화하여 오픈소스 대안 제품보다 뛰어난 성능을 제공합니다.
대규모 데이터에 대한 복잡한 계산을 실시간으로 처리하여 연산 집약적인 AI 및 HPC 환경에서도 안정적이고 빠른 성능을 보장합니다.
주요 기능 1
대규모 데이터의 실시간 처리를 위한 고속 행렬 연산자 지원
AI 및 HPC 응용을 위해 설계된 고성능 행렬 연산 프레임워크로, 이미지·신호 처리와 선형 대수 등 다양한 연산자를 최적화하여 오픈소스 대안 제품보다 뛰어난 성능을 제공합니다.
대규모 데이터에 대한 복잡한 계산을 실시간으로 처리하여 연산 집약적인 AI 및 HPC 환경에서도 안정적이고 빠른 성능을 보장합니다.
주요 기능 2
이기종 하드웨어 및 플랫폼 최적화
NVIDIA · AMD GPU, x64 · ARM CPU 등 다양한 하드웨어 아키텍처에 최적화된 연산자를 제공하며, Windows와 Linux를 포함한 여러 운영체제를 지원해 모든 플랫폼에서 최대 성능을 제공합니다.
미래의 컴퓨팅 인프라 변화에 민첩하게 대응하며 다양한 환경에서 애플리케이션을 손쉽게 개발하고 확장할 수 있습니다.
주요 기능 2
이기종 하드웨어 및 플랫폼 최적화
NVIDIA · AMD GPU, x64 · ARM CPU 등 다양한 하드웨어 아키텍처에 최적화된 연산자를 제공하며, Windows와 Linux를 포함한 여러 운영체제를 지원해 모든 플랫폼에서 최대 성능을 제공합니다.
미래의 컴퓨팅 인프라 변화에 민첩하게 대응하며 다양한 환경에서 애플리케이션을 손쉽게 개발하고 확장할 수 있습니다.
주요 기능 2
이기종 하드웨어 및 플랫폼 최적화
NVIDIA · AMD GPU, x64 · ARM CPU 등 다양한 하드웨어 아키텍처에 최적화된 연산자를 제공하며, Windows와 Linux를 포함한 여러 운영체제를 지원해 모든 플랫폼에서 최대 성능을 제공합니다.
미래의 컴퓨팅 인프라 변화에 민첩하게 대응하며 다양한 환경에서 애플리케이션을 손쉽게 개발하고 확장할 수 있습니다.
주요 기능 3
멀티미디어 워크로드에 특화된 API 및 개발자 친화적인 도구
비디오 스트리밍 및 이미지 처리, 이미지·비디오 디코딩, FFT, 플롯 렌더링, 프로파일링 등 다양한 멀티미디어 기능과 사용하기 쉬운 개발자 도구를 하나의 통합 툴킷으로 제공합니다.
추가 라이브러리 설치 없이 통합 인터페이스만으로 고성능의 안정적인 애플리케이션을 손쉽게 개발하고 운영할 수 있습니다.
주요 기능 3
멀티미디어 워크로드에 특화된 API 및 개발자 친화적인 도구
비디오 스트리밍 및 이미지 처리, 이미지·비디오 디코딩, FFT, 플롯 렌더링, 프로파일링 등 다양한 멀티미디어 기능과 사용하기 쉬운 개발자 도구를 하나의 통합 툴킷으로 제공합니다.
추가 라이브러리 설치 없이 통합 인터페이스만으로 고성능의 안정적인 애플리케이션을 손쉽게 개발하고 운영할 수 있습니다.
주요 기능 3
멀티미디어 워크로드에 특화된 API 및 개발자 친화적인 도구
비디오 스트리밍 및 이미지 처리, 이미지·비디오 디코딩, FFT, 플롯 렌더링, 프로파일링 등 다양한 멀티미디어 기능과 사용하기 쉬운 개발자 도구를 하나의 통합 툴킷으로 제공합니다.
추가 라이브러리 설치 없이 통합 인터페이스만으로 고성능의 안정적인 애플리케이션을 손쉽게 개발하고 운영할 수 있습니다.
주요 기능 4
사용자 정의 연산자에 대한 컴파일러 기반 최적화
컴파일러 기술*을 활용해 사용자가 커스텀 연산자를 손쉽게 구현할 수 있으며, 각 하드웨어 특성에 맞춰 빌트인 연산자처럼 자동으로 최적화합니다.
복잡하고 특수한 애플리케이션 요구사항에도 유연하게 대응하고, 높은 성능과 완전한 기능을 갖춘 고도화된 AI 및 HPC 응용 개발이 가능합니다.
주요 기능 4
사용자 정의 연산자에 대한 컴파일러 기반 최적화
컴파일러 기술*을 활용해 사용자가 커스텀 연산자를 손쉽게 구현할 수 있으며, 각 하드웨어 특성에 맞춰 빌트인 연산자처럼 자동으로 최적화합니다.
복잡하고 특수한 애플리케이션 요구사항에도 유연하게 대응하고, 높은 성능과 완전한 기능을 갖춘 고도화된 AI 및 HPC 응용 개발이 가능합니다.
주요 기능 4
사용자 정의 연산자에 대한 컴파일러 기반 최적화
컴파일러 기술*을 활용해 사용자가 커스텀 연산자를 손쉽게 구현할 수 있으며, 각 하드웨어 특성에 맞춰 빌트인 연산자처럼 자동으로 최적화합니다.
복잡하고 특수한 애플리케이션 요구사항에도 유연하게 대응하고, 높은 성능과 완전한 기능을 갖춘 고도화된 AI 및 HPC 응용 개발이 가능합니다.
개발 중..
Morph 컴파일러
다면체 기반 최적화 지원
자가 정의 및 다단계 중간 표현(IR)
현대적인 프로그래밍 언어 기능
이기종 하드웨어(CPU, GPU, NPU 등) 대응 컴파일 및 가속 지원
개발 중..
Morph 컴파일러
다면체 기반 최적화 지원
자가 정의 및 다단계 중간 표현(IR)
현대적인 프로그래밍 언어 기능
이기종 하드웨어(CPU, GPU, NPU 등) 대응 컴파일 및 가속 지원
개발 중..
Morph 컴파일러
다면체 기반 최적화 지원
자가 정의 및 다단계 중간 표현(IR)
현대적인 프로그래밍 언어 기능
이기종 하드웨어(CPU, GPU, NPU 등) 대응 컴파일 및 가속 지원
성능 비교
성능 비교
CPU 병렬화
16K 이미지 리사이징
0
0
0
소요 시간(ms)
CPU 병렬화
16K 이미지 리사이징
0
0
0
소요 시간(ms)
GPGPU
16K 이미지 리사이징
0
0
0
소요 시간(ms)
GPGPU
16K 이미지 리사이징
0
0
0
소요 시간(ms)
GPGPU
행렬 합성곱 (Float32, 512x512 * 3x3)
0
0
소요 시간(ms)
GPGPU
행렬 합성곱 (Float32, 512x512 * 3x3)
0
0
소요 시간(ms)
사람 트래킹 및 모자이크 애플리케이션 밴치마크
Python
Optimized Python
JETWAVE™
PyTorch
FFmpeg
OpenCV
NumPy
NVIDIA TensorRT
NVIDIA Decoder
NumPy
OpenCV
JETWAVE 표준 라이브러리
소요 시간
: 90,022 ms
평균 프레임
: 27.7 fps
소요 시간
: 58,349 ms
평균 프레임
: 42.8 fps
소요 시간
: 15,525 ms (5.7배 빠름)
평균 프레임
: 161.1 fps
Python
PyTorch
FFmpeg
OpenCV
NumPy
소요 시간
: 90,022 ms
평균 프레임
: 27.7 fps
Optimized Python
NVIDIA TensorRT
NVIDIA Decoder
NumPy
OpenCV
소요 시간
: 58,349 ms
평균 프레임
: 42.8 fps
JETWAVE™
JETWAVE 표준 라이브러리
소요 시간
: 15,525 ms (5.7배 빠름)
평균 프레임
: 161.1 fps