title: "OpenAI, ์๋ช ๊ณผํ AI ๋ฒค์น๋งํฌ LifeSciBench ๊ณต๊ฐ" description: "๋ด์ค - ์๋ฌธ ๊ธฐ๋ฐ ์์ฝ ํ์" date: 2026-06-19 tags: [ai-tool] source: "https://www.marktechpost.com/2026/06/17/openai-releases-lifescibench-a-750-task-benchmark-grading-ai-models-on-real-life-science-research-with-expert-written-rubric/" sidebar: order: 0
์ ๋ชฉ(ํ๊ธ): OpenAI, ์๋ช ๊ณผํ AI ๋ฒค์น๋งํฌ LifeSciBench ๊ณต๊ฐ ์๋ฌธ ์ ๋ชฉ(์๋ฌธ): OpenAI Releases LifeSciBench, a 750-Task Benchmark Grading AI Models on Real Life-Science Research With Expert-Written Rubric ์๋ฌธ: OpenAI Releases LifeSciBench, a 750-Task Benchmark Grading AI Models on Real Life-Science Research With Expert-Written Rubric ์์ค: marktechpost MD ํ์ผ: content/2026-06-19/marktechpost-openai-releases-lifescibench-a-750-task-benchmark-.md
ํต์ฌ ๋ด์ฉ
OpenAI๊ฐ 750๊ฐ ๊ณผ์ ๋ก ๊ตฌ์ฑ๋ ์๋ช ๊ณผํ AI ๋ฒค์น๋งํฌ LifeSciBench๋ฅผ ๊ณต๊ฐํ์ด์. ์ต๊ฐ ๋ชจ๋ธ๋ 3๊ฐ ์ค 1๊ฐ ๊ณผ์ ๋ฐ์ ํต๊ณผ ๋ชป ํ ๋งํผ ๋์ด๋๊ฐ ๋๊ฑฐ๋ ์.
173๋ช ์ ๋ฐ์ฌ๊ธ ๊ณผํ์๊ฐ ์ง์ ์์ฑํ ๊ณผ์ ๋ค์ด์์. ๊ฒ๋ํยท์์ฝํํยท์์๊ณผํ ๋ฑ 7๊ฐ ๋ถ์ผ๋ฅผ ๋ค๋ฃจ๊ณ , ๊ณผ์ ์ 79%๊ฐ ํ๊ท 4๋จ๊ณ ์ด์์ ์ถ๋ก ์ ์๊ตฌํด์. ์ฃผ๊ด์ ์์ ํ์ด๋ผ ๋จ์ ์๊ธฐ๋ก๋ ์ ๋ ํต๊ณผ ๋ชป ํด์.
์ฑ์ ๋ ์ ๋ฐํด์. ๊ณผ์ ๋น ํ๊ท 25๊ฐ ๊ธฐ์ค(์ด 19,020๊ฐ)์ผ๋ก ๋ถ๋ถ ์ ์๋ฅผ ๋งค๊ธฐ๊ณ , 70% ์ด์ ๋ฐ์์ผ ํต๊ณผ์์. AI๊ฐ ์๋ช ๊ณผํ ์ค๋ฌด์์ ์ง์ง ์ธ ๋งํ์ง ๊ฐ๋ฆฌ๋ ๊ธฐ์ค์ด ์๊ธด ๊ฑฐ์์.
์ก๋์ค์ ํ๋ง๋
์ต๊ฐ ๋ชจ๋ธ๋ ํต๊ณผ์จ 33% ์์ค์ด์์. AI๊ฐ ์ค์ ์ฐ๊ตฌ ํ์ฅ์์ ์ธ ์ ์๋์ง ๊ฐ๋ ํ๋ ์ฒซ ๊ธฐ์ค์ด ์๊ธด ๊ฑฐ์์.