2026-03-23

핡심은 데이터 독점을 μ •λ©΄ λŒνŒŒν•œ μ μ΄μ—μš”

πŸ’‘ ν•œμ€„ μš”μ•½|핡심은 데이터 독점을 μ •λ©΄ λŒνŒŒν•œ μ μ΄μ—μš”.

μ˜€ν”ˆμ†ŒμŠ€ 검색 μ—μ΄μ „νŠΈ OpenSeekerκ°€ 단 ν•œ 번의 ν•™μŠ΅κ³Ό 1만1700개 λ°μ΄ν„°λ§ŒμœΌλ‘œ AlibabaκΈ‰ μ„±λŠ₯을 λƒˆμ–΄μš”.

핡심은 데이터 독점을 μ •λ©΄ λŒνŒŒν•œ μ μ΄μ—μš”. μƒν•˜μ΄κ΅ν†΅λŒ€ νŒ€μ΄ ν•™μŠ΅ 데이터(MIT), μ½”λ“œ, 30B SFT λͺ¨λΈ κ°€μ€‘μΉ˜λ₯Ό μ „λΆ€ κ³΅κ°œν–ˆκ±°λ“ μš”. κ·Έλ™μ•ˆ λΉ…ν…Œν¬κ°€ 숨겨온 β€˜λ°μ΄ν„°β€™κΉŒμ§€ μ—° κ±°μ˜ˆμš”.

데이터 생성 방식도 μ •κ΅ν•΄μš”. 68GB μ˜μ–΄+9GB 쀑ꡭ어 μ›Ή μ½”νΌμŠ€μ—μ„œ 링크 κ·Έλž˜ν”„λ₯Ό 따라 정보λ₯Ό λͺ¨μœΌκ³ , 고유λͺ…사λ₯Ό λͺ¨ν˜Έν•œ ν‘œν˜„μœΌλ‘œ λ°”κΏ” λ‹¨μˆœ ν‚€μ›Œλ“œ 검색을 λ§‰μ•˜μ–΄μš”. 또 2단계 ν•„ν„°λ‘œ 도ꡬ 없이 λͺ» ν’€κ³ , λ¬Έλ§₯이 있으면 ν’€ 수 μžˆλŠ” 문제만 λ‚¨κ²Όμ–΄μš”.

μ˜λ―ΈλŠ” λΆ„λͺ…ν•΄μš”. AI μ—μ΄μ „νŠΈ 경쟁λ ₯이 λͺ¨λΈ 크기보닀 β€˜κ²€μ¦λœ 곡개 데이터 νŒŒμ΄ν”„λΌμΈβ€™μœΌλ‘œ μ΄λ™ν•˜κΈ° μ‹œμž‘ν•œ μ‹ ν˜Έμ˜ˆμš”.

이 글이 μ–΄λ• λ‚˜μš”?