Cortexys Tech Blog
AI 기술
인사이트
최신 AI 연구 동향, 실무 적용 사례,
기술 분석을 Cortexys가 공유합니다.
8
게시글
2
카테고리
2026
Since
![[논문] ReflexiCoder: 컴파일러 없이 스스로 코드를 고치는 AI](https://arxiv.org/html/2603.05863v2/x1.png)
[논문] ReflexiCoder: 컴파일러 없이 스스로 코드를 고치는 AI
강화학습으로 외부 도구 없이 스스로 코드를 반성하고 수정하는 ReflexiCoder를 분석합니다. 8B 파라미터로 GPT-5.1과 경쟁하며, 역설적으로 반성 과정이 토큰 사용량을 36% 줄이는 놀라운 결과를 보입니다.
Cortexys2026.03.15총 8개의 글

[논문] Less is More — 700만 파라미터로 Gemini 2.5 Pro를 이기는 초소형 추론 모델 TRM
Samsung AI Lab이 발표한 Tiny Recursive Model(TRM)은 7M 파라미터 단일 네트워크로 ARC-AGI에서 Gemini 2.5 Pro를 앞서는 성능을 달성했다. 완전 역전파·단일 네트워크·EMA 세 가지 단순화가 HRM 대비 30%p 이상의 성능 향상을 이끌어낸 원리를 분석한다.
![[논문] KoALa 한국어 음성 AI를 제대로 평가하는 최초의 종합 벤치마크](https://arxiv.org/html/2604.19782v1/images/K-Bench-A.png)
[논문] KoALa 한국어 음성 AI를 제대로 평가하는 최초의 종합 벤치마크
Qwen3-Omni, Gemini, GPT-4o Audio 같은 대형 오디오 언어 모델의 한국어 음성 이해 능력을 평가하는 최초의 범용 벤치마크. ASR, ST, SQA, SIF 외에 음성 모달리티 충실성(SCA-QA)과 위치 인식 장형식 이해(PA-QA)라는 두 가지 새로운 평가 차원을 제시한다.
![[논문] 데이터가 적을 때 이미지 AI를 제대로 훈련하는 법 - APT기법](https://arxiv.org/html/2507.02687v1/x1.png)
[논문] 데이터가 적을 때 이미지 AI를 제대로 훈련하는 법 - APT기법
참조 이미지가 몇 장 없을 때 디퓨전 모델이 과적합되는 문제를 세 가지 전략으로 해결한다. 타임스텝별 실시간 과적합 감지(ATA), 특성 맵 통계 안정화(RS), 크로스 어텐션 정렬(AA)로 FID를 21% 개선하고 사용자 선호도 56%를 달성했다.
[KANANA429] AI Safety와 국내 최초 오픈소스 가드레일 Kanana Safeguard
카카오가 공개한 국내 최초 오픈소스 AI 가드레일 Kanana Safeguard의 기술 구조와 카카오의 AI Safety 철학을 Kanana 429 앰배서더 밋업에서 직접 들었습니다.
[KANANA429] Kanana-o 멀티모달 AI의 아키텍처와 서빙 구조
국내 최초 텍스트·음성·이미지 통합 멀티모달 모델 Kanana-o의 모델 머징 개발 방법론, LMSPT 음성 토크나이저, 스트리밍 서빙 최적화, 그리고 API 직접 호출로 수집한 실측 데이터(48청크·TTFA 3.477초)를 분석합니다.
![[논문] ReflexiCoder: 컴파일러 없이 스스로 코드를 고치는 AI](https://arxiv.org/html/2603.05863v2/x1.png)
[논문] ReflexiCoder: 컴파일러 없이 스스로 코드를 고치는 AI
강화학습으로 외부 도구 없이 스스로 코드를 반성하고 수정하는 ReflexiCoder를 분석합니다. 8B 파라미터로 GPT-5.1과 경쟁하며, 역설적으로 반성 과정이 토큰 사용량을 36% 줄이는 놀라운 결과를 보입니다.
![[논문] 모호한 참조가 RAG를 망친다 코리퍼런스 해소(Coreference Resolution)로 검색 정확도를 높이는 법](https://arxiv.org/html/2507.07847v3/x1.png)
[논문] 모호한 참조가 RAG를 망친다 코리퍼런스 해소(Coreference Resolution)로 검색 정확도를 높이는 법
RAG 시스템에서 대명사와 지시사로 인한 참조 모호성이 검색과 생성 품질을 저하시킨다. 8개 임베딩 모델, 7개 LLM, 4개 데이터셋에 걸친 실험으로 공지시 해소(CR)가 Mean pooling 모델의 검색 성능을 향상시키고, 소형 LLM의 QA 성능을 극적으로 개선함을 증명한다. Qwen2.5-7B의 SQuAD F1이 0.40에서 0.80으로 두 배 향상.
![[논문] V-Agent: VLM 기반 멀티에이전트 영상 검색](https://arxiv.org/html/2512.16925v2/figures/vap_SY.png)
[논문] V-Agent: VLM 기반 멀티에이전트 영상 검색
NC AI 연구팀이 ACM CIKM 2025에 발표한 V-Agent를 분석합니다. VLM을 영상 검색 모델로 변환하는 Retrieval Vector 기법, 세 에이전트의 협력 구조, MultiVENT 2.0 SOTA 달성 과정을 수식과 실험 데이터로 상세히 분석합니다.
