주간 테크/개발 뉴스 #2026 4/5 ~ 4/11
2026-04-11
AI
Backend
Infra/Cloud
Tools
GitHub Trending
-
HKUDS/DeepTutor
DeepTutor는 PDF/Markdown 문서를 RAG 기반 지식 허브로 구축하고, Chat·Deep Solve·Quiz·Deep Research·Math Animator 등 5가지 모드를 하나의 스레드에서 제공하는 AI 개인 튜터링 플랫폼이다. 자율적으로 기억·학습·진화하는 TutorBot, AI Co-Writer, Guided Learning 등 에이전트 네이티브 아키텍처를 기반으로 개인화된 학습 경험을 제공하며, Python/Next.js로 구성된 CLI와 SDK까지 지원해 AI 파이프라인에 통합하기 쉽다. 출시 39일 만에 GitHub 10k 스타를 달성할 만큼 커뮤니티 반응이 폭발적이며, Apache-2.0… -
NousResearch/hermes-agent
Hermes Agent는 Nous Research가 개발한 자가 개선형 AI 에이전트로, 경험에서 skill을 생성하고 세션 간 사용자 모델링(Honcho 기반)과 FTS5 대화 검색을 통해 지속적으로 학습하는 closed learning loop가 핵심 특징이다. OpenRouter, OpenAI 등 200개 이상의 모델을 코드 변경 없이 전환할 수 있으며, Telegram/Discord/Slack 등 다중 플랫폼 메시징 게이트웨이와 Docker/SSH/Modal 등 6가지 터미널 백엔드를 지원해 $5 VPS부터 GPU 클러스터까지 어디서나 실행 가능하다. 병렬 서브에이전트 spawn, cron 스케줄러, 40개… -
google-ai-edge/gallery
Google AI Edge Gallery는 Gemma 4를 포함한 오픈소스 LLM을 Android/iOS 기기에서 완전 오프라인으로 실행할 수 있는 앱으로, 인터넷 연결 없이 완전한 프라이버시를 보장하며 온디바이스 AI를 체험할 수 있다. AI 채팅, 이미지 분석(Ask Image), 음성 전사(Audio Scribe), Agent Skills 등 다양한 멀티모달 기능을 제공하며, LiteRT 런타임과 Hugging Face 연동을 통해 커스텀 모델도 직접 로드하고 벤치마크할 수 있다. 모바일에서 최신 생성형 AI를 직접 평가·실험할 수 있는 샌드박스 플랫폼으로, 온디바이스 AI의 실용적 가능성을 탐색하려는 개발자와… -
multica-ai/multica
Multica는 Claude Code, Codex, OpenClaw, OpenCode 등 코딩 에이전트를 실제 팀원처럼 관리할 수 있는 오픈소스 플랫폼으로, 이슈 할당·진행 상황 추적·자율 실행을 지원한다. Next.js 프론트엔드, Go 백엔드, PostgreSQL(pgvector) 구조로 설계되어 셀프호스팅 또는 클라우드로 운영 가능하며, WebSocket 기반 실시간 모니터링과 멀티 워크스페이스를 제공한다. 반복 작업을 재사용 가능한 skill로 축적해 팀의 역량을 복리로 키울 수 있다는 점에서 AI 에이전트 협업 인프라로 주목할 만하다. -
forrestchang/andrej-karpathy-skills
Andrej Karpathy가 지적한 LLM 코딩 문제점(무단 가정, 과도한 복잡화, 불필요한 코드 수정)을 해결하기 위해 설계된 단일CLAUDE.md파일 프로젝트다. Think Before Coding, Simplicity First, Surgical Changes, Goal-Driven Execution 네 가지 원칙을 담고 있으며, Claude Code의 동작을 개선해 더 명확하고 최소한의 코드 변경을 유도한다. Claude Code 플러그인 또는 프로젝트별CLAUDE.md로 간단히 적용할 수 있어, AI 코딩 어시스턴트를 실무에서 활용하는 개발자라면 주목할 만한 실용적… -
google-ai-edge/LiteRT-LM
Google가 개발한 LiteRT-LM은 Android, iOS, 데스크톱, Raspberry Pi 등 엣지 디바이스에서 LLM을 GPU/NPU 가속으로 고성능 실행할 수 있는 오픈소스 추론 프레임워크다. Gemma, Llama, Phi-4, Qwen 등 주요 모델을 지원하며, 멀티모달 입력과 function calling 기반 에이전틱 워크플로우까지 제공한다. Chrome, Chromebook Plus, Pixel Watch 등 Google 실제 제품에 이미 탑재된 프로덕션급 솔루션으로, 클라우드 의존 없이 온디바이스 GenAI를 구현할 수 있다는 점에서 주목할 만하다. -
NVIDIA/personaplex
PersonaPlex는 NVIDIA가 공개한 실시간 full-duplex speech-to-speech 대화 모델로, 텍스트 기반 role prompt와 audio 기반 voice conditioning을 통해 일관된 페르소나로 자연스러운 저지연 음성 대화를 생성한다. Moshi 아키텍처를 기반으로 하며, 합성 및 실제 대화 데이터로 학습해 고객 서비스, 일상 대화 등 다양한 역할을 지원한다. 사전 패키징된 다양한 voice embedding과 함께 오픈 웨이트로 공개되어 커스텀 AI 음성 에이전트 개발에 활용 가능하다는 점이 주목할 만하다. -
microsoft/markitdown
Microsoft가 개발한 MarkItDown은 PDF, Word, Excel, PowerPoint, 이미지, 오디오, YouTube URL 등 다양한 파일 포맷을 LLM 처리에 최적화된 Markdown으로 변환해주는 Python 라이브러리다. 단순 텍스트 추출이 아닌 제목, 목록, 표, 링크 등 문서 구조를 보존하며, LLM이 Markdown을 네이티브로 이해하는 특성을 활용해 토큰 효율도 높다. MCP(Model Context Protocol) 서버 지원과 플러그인 시스템, Azure Document Intelligence 연동 등 LLM 파이프라인과의 통합을 강하게 의식한 설계가 특징이다. -
siddharthvaddem/openscreen
Screen Studio의 유료 대안으로 출시된 무료 오픈소스 화면 녹화 편집 앱으로, Electron + React + PixiJS 기반으로 제작되어 macOS/Windows/Linux를 모두 지원한다. 줌 효과, 모션 블러, 어노테이션, 트림, 속도 조절, 커스텀 배경 등 제품 데모 제작에 필요한 핵심 기능을 갖추고 있으며, 개인 및 상업적 용도 모두 완전 무료로 사용 가능하다. 월 $29의 Screen Studio를 대체할 수 없지만, 기본 기능만 필요한 사용자에게 충분한 선택지를 제공한다는 점에서 주목할 만하다. -
TheCraigHewitt/seomachine
SEO Machine은 Claude Code 기반의 SEO 최적화 블로그 콘텐츠 제작 워크스페이스로,/research,/write,/optimize등 다양한 커스텀 커맨드와 전문 에이전트를 통해 리서치부터 발행까지의 콘텐츠 파이프라인을 자동화한다. Google Analytics 4, Google Search Console, DataForSEO 등 실시간 데이터 연동과 NLP 기반 SEO 품질 분석(0-100 점수), 26가지 마케팅 스킬을 내장해 단순 글쓰기 도구를 넘어 데이터 드리븐 콘텐츠 전략 도구로 활용할 수 있다. Claude Code의 에이전트 확장성을 실제 마케팅 워크플로우에 접목한 실용적…