핵심 정보
- 경력
- 무관(신입포함)
- 학력
- 석사졸업 이상
- 근무형태
- 정규직
- 급여
- 면접 후 결정
- 근무지역
- 서울 강남구 (재택근무 가능)
본 채용정보는 마감되었습니다.
(주)디노티시아에서 채용공고가 시작되면 이메일로 알려드립니다.
상세요강
디노티시아는 AI(인공지능)와 데이터를 융합해 혁신적인 가치를 창출하는 장기기억 인공지능 전문기업입니다.
세계 최초로 개발한 벡터 데이터 연산 가속기인 VDPU(Vector data processing unit)를 기반으로 한 ▲고성능 벡터 데이터베이스, ‘Seahorse(씨홀스)’를 선보이며, 생성형 인공지능 핵심 기술인 검색증강생성(RAG:Retriveal-augmented generation) 솔루션을 구현합니다. 또한 자사 고성능, 저비용 LLM 기반 파운데이션 모델을 활용한 ▲Personal/Edge LLM 디바이스인 ‘Mnemos(니모스)’를 통해 개인화된 AI경험을 가능하게 합니다. 디노티시아는 특화된 반도체와 최적화된 알고리즘을 통합하여 새로운 인공지능 시대를 열고자 합니다. AI에 데이터를 융합하여 장기기억을 가진 AI를 개발함으로써, 누구나 쉽게 이용할 수 있는 낮은 비용의 AGI (Artificial General Intelligence)를 구현하고, AI의 혜택을 대중이 쉽게 누릴 수 있는 미래를 열어갑니다.
● 담당업무
· LLM (Large Language Model) Inference 엔진의 설계 및 개발
· Open Source 기반 Inference 프레임워크(e.g., vLLM)의 구조 분석 및 필요시 커스터마이징
· LLM 워크로드에 대한 정량적 분석 및 병목 지점 프로파일링
· Quantization 및 Pruning 기법을 활용한 추론 경량화 및 최적화 설계 및 구현
· 최신 논문 및 공개된 구현체 기반 최적화 기법 지속적 습득 및 적용
· 시스템/하드웨어 특성에 맞춘 추론 경로 최적화 (e.g., CPU-GPU 간 데이터 이동 최소화, 메모리 계층 활용 등)
● 자격요건
· C++ 또는 Python 기반 개발 능력
· Transformer 구조 및 LLM 아키텍처에 대한 기초적인 이해
· Quantization 또는 Pruning 기법에 대한 이론 및 실습 경험
· Git, Linux 환경 기반 개발 및 디버깅 경험
● 우대사항
· vLLM 또는 유사한 LLM Inference Engine 내부 구조에 대한 깊은 이해 및 수정 경험
· CUDA 및 GPU 최적화 커널 개발 경험
· GPU 아키텍처 및 메모리 계층 구조에 대한 실질적인 이해 (e.g., HBM, L2 cache, shared memory 등)
· Torchscript, TorchDispatch, TorchDynamo 등 PyTorch 시스템 레이어 경험
· 다음 분야에 대한 이해 및 실무 활용 능력 :
- Computer Architecture (CPU/GPU 파이프라인, 메모리 계층 구조 등)
- Heterogeneous Computing · (CPU-GPU 협업 및 오프로드 전략 등)
- Operating System 기초 (메모리 관리, 스케줄링, IO path 등)
· LLM 추론 관련 최신 논문 및 구현체를 빠르게 분석하고 적용하는 능력
세계 최초로 개발한 벡터 데이터 연산 가속기인 VDPU(Vector data processing unit)를 기반으로 한 ▲고성능 벡터 데이터베이스, ‘Seahorse(씨홀스)’를 선보이며, 생성형 인공지능 핵심 기술인 검색증강생성(RAG:Retriveal-augmented generation) 솔루션을 구현합니다. 또한 자사 고성능, 저비용 LLM 기반 파운데이션 모델을 활용한 ▲Personal/Edge LLM 디바이스인 ‘Mnemos(니모스)’를 통해 개인화된 AI경험을 가능하게 합니다. 디노티시아는 특화된 반도체와 최적화된 알고리즘을 통합하여 새로운 인공지능 시대를 열고자 합니다. AI에 데이터를 융합하여 장기기억을 가진 AI를 개발함으로써, 누구나 쉽게 이용할 수 있는 낮은 비용의 AGI (Artificial General Intelligence)를 구현하고, AI의 혜택을 대중이 쉽게 누릴 수 있는 미래를 열어갑니다.
● 담당업무
· LLM (Large Language Model) Inference 엔진의 설계 및 개발
· Open Source 기반 Inference 프레임워크(e.g., vLLM)의 구조 분석 및 필요시 커스터마이징
· LLM 워크로드에 대한 정량적 분석 및 병목 지점 프로파일링
· Quantization 및 Pruning 기법을 활용한 추론 경량화 및 최적화 설계 및 구현
· 최신 논문 및 공개된 구현체 기반 최적화 기법 지속적 습득 및 적용
· 시스템/하드웨어 특성에 맞춘 추론 경로 최적화 (e.g., CPU-GPU 간 데이터 이동 최소화, 메모리 계층 활용 등)
● 자격요건
· C++ 또는 Python 기반 개발 능력
· Transformer 구조 및 LLM 아키텍처에 대한 기초적인 이해
· Quantization 또는 Pruning 기법에 대한 이론 및 실습 경험
· Git, Linux 환경 기반 개발 및 디버깅 경험
● 우대사항
· vLLM 또는 유사한 LLM Inference Engine 내부 구조에 대한 깊은 이해 및 수정 경험
· CUDA 및 GPU 최적화 커널 개발 경험
· GPU 아키텍처 및 메모리 계층 구조에 대한 실질적인 이해 (e.g., HBM, L2 cache, shared memory 등)
· Torchscript, TorchDispatch, TorchDynamo 등 PyTorch 시스템 레이어 경험
· 다음 분야에 대한 이해 및 실무 활용 능력 :
- Computer Architecture (CPU/GPU 파이프라인, 메모리 계층 구조 등)
- Heterogeneous Computing · (CPU-GPU 협업 및 오프로드 전략 등)
- Operating System 기초 (메모리 관리, 스케줄링, IO path 등)
· LLM 추론 관련 최신 논문 및 구현체를 빠르게 분석하고 적용하는 능력
함께하기 위한 방법
- 접수기간 : 2025년 06월 10일 (목)14시 00분 ~ 2025년 07월 01일 (화) 15시 37분
- 접수방법 : 홈페이지 지원
- 이력서양식 : 자유양식
함께하기 위한 여정
- 서류전형
- 온라인면접
- 실무면접
- 임원면접
- 처우협의
- 최종합격
- 본 기업은 구직자의 소중한 개인정보를 안전하게 보호하고 지키기 위해 노력하는 기업입니다.
- 구직자도 함께 본인의 개인정보를 안전하게 보호하기 위해 노력해야 합니다.
기업정보
이 기업의 다른 공고 (3건)- 대표자명*
- 정무경
- 기업형태
- 중소기업, 병역특례 인증업체
- 업종
- 그 외 기타 전기장비 제조업
- 사원수*
- 86 명 (2024년 기준)
- 설립일*
- 2023년 6월 28일 (업력 3년차)
- 매출액*
- 3억 3,990만원 (2024년 기준)
- 기업주소
- 서울 서초구 강남대로51길 1, 7층 (서초동,511타워)
* 항목은 기업이 직접 기재하였으며, 본사/지점 등의 정보는 다르게 관리될 수 있습니다.
이어보는 Ai매치 채용정보
사람인 인공지능 기술 기반으로 맞춤 공고를 추천해드리는 사람인의 채용정보제공 서비스입니다.
사람인 인공지능 기술 기반으로 맞춤 공고를 추천해드리는 사람인의 채용정보제공 서비스입니다.