Tag: llm

All the articles with the tag "llm".

Qwen3.5 로컬 추론 벤치마크 결과표: 4대 하드웨어 × 5개 엔진

Updated: 16 Apr, 2026

M5 Max, RTX 3090×2, DGX Spark GB10, Ryzen AI MAX 395에서 Qwen3.5 4개 모델(9B~122B)의 생성 속도, 프리필 속도를 llama.cpp, MLX, Ollama, vLLM, Lemonade로 측정한 결과 비교표.
로컬 LLM 추론 벤치마크: 4대 하드웨어 × 5개 엔진 실험 설계

Updated: 14 Apr, 2026

Qwen3.5 모델을 4개 플랫폼(M5 Max, RTX 3090×2, DGX Spark, Ryzen AI MAX 395+)에서 측정하는 크로스 플랫폼 벤치마크의 실험 설계, 방법론, 주의사항을 정리합니다.
Qwen3.5 크로스 플랫폼 벤치마크: 4대 하드웨어 × 5개 엔진 성능 비교

Updated: 14 Apr, 2026

Mac M5 Max, RTX 3090×2, DGX Spark, Ryzen AI MAX 395+에서 Qwen3.5를 동일 조건으로 측정한 벤치마크. cold prefill, cache 차단, 실행 순서 랜덤화 적용.
GraphRAG 파이프라인 실전 구축 — 벡터 검색에서 그래프 확장까지

4 Apr, 2026

벡터 RAG만으로 답할 수 없는 멀티홉 질문을 GraphRAG로 해결하는 방법. from_existing_graph 한 줄로 노드 벡터화, CypherQAChain으로 자연어→Cypher 자동 변환까지.
langchain-age 벡터 검색 완전 정복 — Hybrid Search, MMR, 메타데이터 필터링

4 Apr, 2026

pgvector 벡터 검색에서 Hybrid Search가 왜 필요한지, 어떤 전략을 언제 써야 하는지 실측 비교와 코드로 설명한다. HNSW vs IVFFlat 인덱스 선택 기준 포함.
PostgreSQL 하나로 AI Agent 전체 스택 — LangGraph + langchain-age

4 Apr, 2026

Neo4j+Redis+Pinecone 대신 PostgreSQL 1개로 AI Agent를 운영할 수 있을까? 그래프, 벡터, 체크포인트, 장기 메모리를 하나의 DB에 통합하는 실전 아키텍처.
GraphRAG를 PostgreSQL만으로 구축하기 — Neo4j 없이 Apache AGE + pgvector

3 Apr, 2026

Neo4j 없이 PostgreSQL 하나로 GraphRAG 파이프라인을 구축하는 방법. Apache AGE와 pgvector를 조합해 그래프 + 벡터 검색을 단일 DB에서 운영하는 실전 가이드.

Tag: llm

Qwen3.5 로컬 추론 벤치마크 결과표: 4대 하드웨어 × 5개 엔진

로컬 LLM 추론 벤치마크: 4대 하드웨어 × 5개 엔진 실험 설계

Qwen3.5 크로스 플랫폼 벤치마크: 4대 하드웨어 × 5개 엔진 성능 비교

GraphRAG 파이프라인 실전 구축 — 벡터 검색에서 그래프 확장까지

langchain-age 벡터 검색 완전 정복 — Hybrid Search, MMR, 메타데이터 필터링

PostgreSQL 하나로 AI Agent 전체 스택 — LangGraph + langchain-age

GraphRAG를 PostgreSQL만으로 구축하기 — Neo4j 없이 Apache AGE + pgvector