- AI
Agent를 위한 웹 브라우저
Agent로 웹 브라우징하기
사람들은 이미 많은 일을 웹에서 하고 있습니다.
에이전트에게 줄 최적의 도구가 웹 브라우저는 아닙니다.
그러나 특별하게 다시 개발된 도구를 꼭 손에 넣지 않더라도 LLM 기반 AI 에이전트들이 저절로 사람처럼 작업을 시작할 수 있다면 도움이 될 것입니다.
터미널용 웹 브라우저 wb를 작성하였습니다.
실험 1. 알라딘에서 베스트셀러 찾기
알라딘에서 베스트셀러를 찾아봅시다.
▗ ▗ ▖ ▖ Claude Code v2.0.29
Sonnet 4.5 · Claude Max
▘▘ ▝▝ /Users/kyungilchoi/Workspace/hanpama/paddle-server
> 터미널용 웹 브라우저 wb가 준비되어 있다. wb --help 로 사용법을 확인하라. 알라딘 인터넷 서점의 컴퓨터 분야 베스트셀러 5권을 조사하라.
⏺ wb 브라우저의 사용법을 확인하고 알라딘 인터넷 서점의 컴퓨터 분야 베스트셀러를 조사하겠습니다.
⏺ Bash(wb --help)
⎿ wb :: The TUI Web Browser
Usage:
… +24 lines (ctrl+o to expand)
⏺ Bash(wb open "https://www.aladin.co.kr/shop/common/wbest.aspx?BranchType=1")
⎿ 주간 베스트 : 알라딘
────────────────────────────────────────────────────────────────
[]{31c47cd1}
… +102 lines (ctrl+o to expand)
⏺ Bash(wb show --offset 100)
⎿ 주간 베스트 : 알라딘
────────────────────────────────────────────────────────────────
[스테디셀러]{40d7e739}
… +102 lines (ctrl+o to expand)
⏺ 컴퓨터/모바일 카테고리를 찾았습니다. 해당 카테고리로 이동하겠습니다.
⏺ Bash(wb click d25ed4cd)
⎿ 주간 베스트 : 알라딘
────────────────────────────────────────────────────────────────
[]{b7645f75}
… +103 lines (ctrl+o to expand)
⏺ Bash(wb show --offset 200)
⎿ 주간 베스트 : 알라딘
────────────────────────────────────────────────────────────────
… +103 lines (ctrl+o to expand)
⏺ 좋습니다! 컴퓨터/모바일 분야 베스트셀러를 찾았습니다. 더 많은 책을 보겠습니다.
⏺ Bash(wb show --offset 300)
⎿ 주간 베스트 : 알라딘
────────────────────────────────────────────────────────────────
할인), 마일리지
… +103 lines (ctrl+o to expand)
⏺ Bash(wb show --offset 400)
⎿ 주간 베스트 : 알라딘
────────────────────────────────────────────────────────────────
… +103 lines (ctrl+o to expand)
⏺ 완벽합니다! 컴퓨터/모바일 분야 베스트셀러 상위 5권을 확인했습니다. 정리해드리겠습니다.
알라딘 인터넷 서점 컴퓨터 분야 베스트셀러 Top 5
1위: AI 2026 - 트렌드 & 활용백과
- 저자: 김덕진
- 출판사: 스마트북스
- 출간일: 2025년 10월
- 가격: 25,000원 → 22,500원 (10% 할인)
- 전자책: 18,000원
2위: AI 엔지니어링
- 부제: 파운데이션 모델을 활용한 시스템 설계부터 개선까지, AI 앱 개발 원스톱 가이드
- 저자: 칩 후옌 / 역자: 변성윤
- 출판사: 한빛미디어
- 출간일: 2025년 9월
- 가격: 40,000원 → 36,000원 (10% 할인)
- 전자책: 28,800원
- 평점: 9.3/10 (리뷰 3개)
3위: 요즘 당근 AI 개발
- 부제: AI가 만든 파도 위에서 과감히 서핑하는 법 / AI 에이전트, 프롬프트 엔지니어링, VoC 자동 분석, 운영자동화, 바이브 코딩 AI 검색과 추천까지 당근의 AI 활용 이야기
- 저자: 당근 팀
- 출판사: 골든래빗(주)
- 출간일: 2025년 10월
- 가격: 22,000원 → 19,800원 (10% 할인)
- 평점: 9.9/10 (리뷰 65개)
4위: 진짜 쓰는 실무 엑셀
- 부제: 유튜브 대표 엑셀 채널, 오빠두가 알려 주는 엑셀 함수, 보고서 작성, 데이터 분석 노하우!
- 저자: 오빠두(전진권)
- 출판사: 제이펍
- 출간일: 2022년 2월
- 가격: 21,000원 → 18,900원 (10% 할인)
- 전자책: 13,230원
- 평점: 9.7/10 (리뷰 29개)
- 세일즈포인트: 64,708 (43주 베스트셀러)
5위: 마침내 특이점이 시작된다
- 부제: 인류가 AI와 결합하는 순간
- 저자: 레이 커즈와일
- 출간일: 8주 베스트셀러
주목할 점은 상위 3권이 모두 AI 관련 도서이며, 특히 2025년 10월에 출간된 최신 도서들이 베스트셀러에 진입했다는 것입니다.
wb open, click, show를 적절하게 사용하여 웹 사이트를 네비게이션합니다.
> wb --help
wb :: The TUI Web Browser
Usage:
wb [flags]
wb [command]
Available Commands:
back Navigate back in the current tab's history
click Click an interactive element by its hash
close Close the current or a specific tab
completion Generate the autocompletion script for the specified shell
describe Describe an interactive element by its hash
enter Press Enter on the currently focused element
forward Navigate forward in the current tab's history
help Help about any command
list List all open tabs
new Open a new tab with the specified URL
open Navigate the current tab to a different URL
respond Respond to a pending JavaScript dialog
show Show the current tab as markdown
switch Switch focus to a specific tab
type Type text into the currently focused element
Flags:
-h, --help help for wb
Use "wb [command] --help" for more information about a command.
wb open을 통해 웹 페이지를 열 수 있습니다. 페이지가 idle이 되면, wb는 DOM을 읽은 후 접근성 요소를 고려하며 마크다운 느낌이 나는 텍스트로 렌더링합니다.
인터랙티브 요소는 해시를 표시하여 에이전트가 wb click {hash}로 상호작용하도록 유도합니다.
> wb open "https://www.aladin.co.kr/shop/common/wbest.aspx?BranchType=1"
주간 베스트 : 알라딘
────────────────────────────────────────────────────────────────
[]{31c47cd1}
[닫기]{176a49f2}
- [HOME]{87261c60}
- [국내도서]{8cb5010b}
- [전자책]{201d874a}
- [만권당]{22bbbc7b}
[첫달무료]{54176633}
무제한독서
- [외국도서]{04a99b13}
- [알라딘굿즈]{c7373391}
- [온라인중고]{70cc60de}
- [중고매장]{62278461}
- [우주점]{2a5d5e81}
- [음반]{86eb5395}
- [블루레이]{94366fe9}
- [커피]{dfb8088c}
- [로그인]{c28be5bc}
- [회원가입]{c75ea1e5}
- [마이페이지]{2e360bdd}
- [고객센터]{118b289c}
- [장바구니]{18ecd7e4}
(...생략...)
[신간 베스트]{ef78bee2}
────────────────────────────────────────────────────────────────
[Lines 1-100 / 3699] • Next: wb show --offset 100
• tab-1 | https://www.aladin.co.kr/shop/common/wbest.aspx?BranchType=1
컨텍스트를 낭비하지 않도록 한 페이지에 표시되는 텍스트의 양은 상한선이 정해져 있습니다.
페이지 콘텐츠가 더 있고, 추가로 렌더링 가능함을 보이기 위해,
- 현재 화면에서 보이는 라인 수와 전체 라인 수
[Lines 1-100 / 3699] - 그리고 다음 영역을 렌더하는 명령어 소개
wb show --offset 100
를 표시하여 페이지에 대한 심상을 잘 그리도록 도와줍니다.
실험 2. 책 검색하기
검색도 해 봅시다.
▗ ▗ ▖ ▖ Claude Code v2.0.29
Sonnet 4.5 · Claude Max
▘▘ ▝▝ /Users/kyungilchoi/Workspace/hanpama/paddle-server
> 터미널용 웹 브라우저 wb가 준비되어 있다. wb --help 로 사용법을 확인하라. 교보문고에서 리처드 파인만의 컴퓨터 강의라는 책을 찾아라.
⏺ 웹 브라우저를 사용하여 교보문고에서 리처드 파인만의 컴퓨터 강의를 검색하겠습니다.
먼저 wb의 사용법을 확인하겠습니다.
⏺ Bash(wb --help)
⎿ wb :: The TUI Web Browser
Usage:
… +24 lines (ctrl+o to expand)
⏺ 이제 교보문고 웹사이트에 접속하여 "리처드 파인만의 컴퓨터 강의"를 검색하겠습니다.
⏺ Bash(wb new "https://www.kyobobook.co.kr")
⎿ 교보문고 | 대한민국 최고의 도서쇼핑몰
────────────────────────────────────────────────────────────────
교보문고
… +103 lines (ctrl+o to expand)
⏺ 교보문고 메인 페이지가 로드되었습니다. 검색창에 "리처드 파인만의 컴퓨터 강의"를 입력하겠습니다.
⏺ Bash(wb click 6c4852bb)
⎿ 교보문고 | 대한민국 최고의 도서쇼핑몰
────────────────────────────────────────────────────────────────
(No URL change - showing diff)
… +157 lines (ctrl+o to expand)
⏺ 검색창이 활성화되었습니다. 이제 "리처드 파인만의 컴퓨터 강의"를 입력하겠습니다.
⏺ Bash(wb type "리처드 파인만의 컴퓨터 강의")
⎿ 교보문고 | 대한민국 최고의 도서쇼핑몰
────────────────────────────────────────────────────────────────
(No URL change - showing diff)
… +168 lines (ctrl+o to expand)
⏺ 완벽합니다! 검색 결과가 바로 나타났습니다. 교보문고에서 "파인만의 컴퓨터 강의"를 찾았습니다. 첫 번째 결과를 클릭하여 자세한 정보를 확인하겠습니다.
⏺ Bash(wb click d5b244dd)
⎿ 파인만의 컴퓨터 강의 | 리처드 파인만 - 교보문고
────────────────────────────────────────────────────────────────
[본문 바로가기]{68da717d}
… +104 lines (ctrl+o to expand)
⏺ 좋습니다! 책의 상세 페이지로 이동했습니다. 더 많은 정보를 보기 위해 스크롤을 내려보겠습니다.
⏺ Bash(wb show --offset 100)
⎿ 파인만의 컴퓨터 강의 | 리처드 파인만 - 교보문고
────────────────────────────────────────────────────────────────
[구판보기]{d16217f5}
… +104 lines (ctrl+o to expand)
⏺ 계속해서 책의 설명 부분을 확인하겠습니다.
⏺ Bash(wb show --offset 200)
⎿ 파인만의 컴퓨터 강의 | 리처드 파인만 - 교보문고
────────────────────────────────────────────────────────────────
- 거래처 품절 상태로 재고수량이 충분치 않아 조기 품절될 수 있으며, 상품 상태가 깨끗하지 않을 수 있습니다. 양해 부탁드립니다.
… +104 lines (ctrl+o to expand)
⏺ 계속해서 책의 상세 정보를 확인하겠습니다.
⏺ Bash(wb show --offset 300)
⎿ 파인만의 컴퓨터 강의 | 리처드 파인만 - 교보문고
────────────────────────────────────────────────────────────────
[정지훈의 양자 컴퓨터 강의: AI 다음의 게임 체인저 양자 컴퓨터의 모든 것]{c1a700a8}
… +104 lines (ctrl+o to expand)
⏺ 좋습니다! 이제 책의 상세 설명을 더 보겠습니다.
⏺ Bash(wb show --offset 400)
⎿ 파인만의 컴퓨터 강의 | 리처드 파인만 - 교보문고
────────────────────────────────────────────────────────────────
… +108 lines (ctrl+o to expand)
⏺ 완벽합니다! 교보문고에서 "파인만의 컴퓨터 강의" (원제: 리처드 파인만의 컴퓨터 강의)를 찾았습니다.
책 정보 요약:
제목: 파인만의 컴퓨터 강의 (2판)부제: 양자 컴퓨터를 고안한 천재가 들려주는 계산 이야기
저자: 리처드 파인만 (Richard Feynman)엮음: 토니 헤이번역: 서환수출판사: 한빛미디어출간일: 2025년 6월 25일 (1쇄: 2006년 5월 29일)
가격:
- 종이책: 26,100원 (정가 29,000원, 10% 할인)
- eBook: 20,880원
평점: 10.0/10 (리뷰 11개)
책 소개:
노벨물리학상 수상자 리처드 파인만이 1983~1986년 캘리포니아 공과대학에서 마지막으로 강의한 컴퓨터 과학 과목의 내용을 담은 책입니다. 파인만은 계산의 물리적 본질부터
시작해 컴퓨터 이론 전반을 탐색하며 '컴퓨터란 무엇인가'를 독창적인 시각으로 성찰했습니다.
2판에서는 파인만이 처음 제안한 '양자역학적 컴퓨터' 개념이 오늘날의 양자 컴퓨터에 미친 영향과 AI 관련 내용까지 추가되었습니다.
대상 독자:
- 하드웨어 아키텍처·계산 이론의 기초를 다지고 싶은 학부·대학원생
- 컴퓨팅 한계를 물리학적 관점에서 탐구하고 싶은 개발자
- 컴퓨터의 동작 원리를 깊이 있게 이해하고 싶은 모든 사람
검색을 잘 수행하여 고수준의 목표인 책 정보 찾기를 훌륭하게 달성했습니다. 검색창과 어떻게 상호작용했을까요?
> wb new "https://www.kyobobook.co.kr"
교보문고 | 대한민국 최고의 도서쇼핑몰
────────────────────────────────────────────────────────────────
교보문고
(...생략...)
[]{c268c297}
[통합검색]{28e9b040}
[Input/search: (김붕년 교수가 좋아서 번역한 그림책)]{6c4852bb}
[search button]{e03ddbd3}
[장바구니 아이콘장바구니 아이콘]{a7592970}
(...생략...)
[Input/search: (placeholder)]{6c4852bb} 형식으로 검색 입력을 드러냅니다.
아래에 [search button]{e03ddbd3} 까지 있으니 검색 입력이겠거니 에이전트가 잘 유추하는 것 같습니다.
이어서,
wb click 6c4852bb(검색창에 포커스)- 교보문고 메인 페이지가 로드되었습니다. 검색창에 “리처드 파인만의 컴퓨터 강의”를 입력하겠습니다.
wb type "리처드 파인만의 컴퓨터 강의"(검색창에 텍스트 입력)- 완벽합니다! 검색 결과가 바로 나타났습니다. 교보문고에서 “파인만의 컴퓨터 강의”를 찾았습니다. 첫 번째 결과를 클릭하여 자세한 정보를 확인하겠습니다.
wb click d5b244dd(자동완성창에 나온 책 링크 클릭)
텍스트의 나열로 된 컨텍스트에서 브라우저 탭, 네비게이션, 링크, 클릭 등으로 구성된 추상적 모델을 안정적으로 조작하고 있다는 것이 인상적입니다.
Agent를 위한 도구 만들기
wb의 개발은 극히 일부를 제외하고는 Claude Code가 맡아서 했습니다. 사용자 테스트는 Codex, Gemini, Claude Code가 골고루 했고요.
주 개발자인 Claude Code가 계속 코딩 세션을 유지하고 가끔 ‘사용자 피드백’을 다른 채널에서 복사해서 주 개발자에게 전해 주었습니다.
Anthropic에서도 에이전트를 위한 도구 만들기에 대해 좋은 설명을 들을 수 있었습니다.
한편 에이전트가 실수하는 순간을 잡아서, 인터뷰하면 도움이 됩니다.
- “잠깐, 너 왜 착각했어?”
- “이렇게 하는 방법은 왜 떠올리지 못한 것 같아?”
그럼 모델이 자기가 생각하고 있던 것을 해줍니다.
- “탭이 뒤에서 새로 열린 걸 몰랐습니다.”
- “입력창이 포커스가 되었는지 아닌지 몰랐습니다.”
- “아직 페이지가 로딩되고 있는 건지 몰랐습니다.”
이러한 피드백은 사람이 웹 페이지를 보며 일어나는 현상을 설명하는 것과 매우 유사합니다.
걸러서 들어야 하긴 합니다.
- “git log 처럼 인터랙티브하게 상하 스크롤이 된다면 편하겠네요.” (그렇게 하면 너는 이걸 못 쓰게 될텐데…)
Agent 만들기
AI 에이전트는 아래의 3 요소로 구성됩니다.
- 모델
- 프롬프트
- 도구 세트
모델의 파라미터는 건드리는 게 쉽지 않고 이미 frontier labs에서 잘 하고 있으니 우리는 프롬프트와 도구 세트에 집중하고 있습니다. 그러나 원하는 대로 작동하는 에이전트를 만든다는 게 매우 어렵습니다.
프롬프트와 도구 세트는 모델 밖에서 모델에게 어떠한 목표로의 동력과 상황에 대한 심상을 만들게끔 해 줘야 합니다. 에이전트는 프롬프트와 도구 사용의 궤적을 통해 머릿속에 어떠한 affordance를 구축하고 있어야 합니다.
앞으로의 아이디어
모델이 도구 세트로부터 어떻게 affordance를 구축하는가에 대한 조금의 감을 얻기 위해 노력 중입니다.
또, 센서와 모터, 스키마, 계약, 멀티 에이전트 시스템이라는 키워드를 가지고 탐구를 계속하려 합니다.