바이트 계산기 · 글자수 세기
한글·영문·숫자·특수문자 바이트 수를 정확하게 계산
바이트 계산기란?
바이트 계산기는 텍스트에 포함된 글자수와 바이트 수를 정확하게 측정하는 도구입니다. 단순히 글자를 세는 것처럼 보이지만, 실제로는 문자의 종류(한글·영문·특수문자)와 인코딩 방식에 따라 바이트 수가 크게 달라지기 때문에 정확한 계산이 필요합니다. 데이터베이스 설계, 문자 메시지 전송, SNS 게시글 작성, 프로그램 개발 등 다양한 분야에서 바이트 수는 핵심 제약 조건이 됩니다.
바이트와 글자수의 차이
많은 사람들이 ‘글자수 = 바이트 수’라고 생각하지만, 이는 영문자에만 해당하는 이야기입니다. 컴퓨터가 문자를 저장할 때는 글자마다 다른 크기의 저장 공간을 사용합니다.
| 문자 종류 | UTF-8 | EUC-KR | UTF-16 |
|---|---|---|---|
| 영문·숫자·기호 (ASCII) | 1 byte | 1 byte | 2 bytes |
| 한글 (완성형) | 3 bytes | 2 bytes | 2 bytes |
| 한자·기타 유니코드 | 3 bytes | 2 bytes | 2 bytes |
| 이모지 (Emoji) | 4 bytes | 미지원 | 4 bytes |
예를 들어 “안녕하세요”는 5글자이지만, UTF-8 기준으로는 15바이트, EUC-KR 기준으로는 10바이트를 차지합니다. 이처럼 같은 텍스트라도 인코딩 방식에 따라 바이트 수가 달라지기 때문에, 상황에 맞는 올바른 기준을 선택하는 것이 중요합니다.
UTF-8, EUC-KR, UTF-16의 차이
UTF-8 (웹 표준)
UTF-8은 현재 인터넷과 웹 개발에서 가장 널리 사용되는 문자 인코딩 방식입니다. HTML, JSON, 대부분의 데이터베이스(MySQL, PostgreSQL)의 기본 인코딩이며, 영문자는 1바이트, 한글은 3바이트로 처리합니다. MySQL varchar(100)은 UTF-8 기준 최대 100글자를 저장할 수 있지만, 한글이 포함된 경우 실제 바이트 한도에 주의해야 합니다.
EUC-KR (한국 표준)
EUC-KR은 과거 한국에서 주로 사용하던 인코딩 방식으로, 한글을 2바이트로 처리합니다. 구형 레거시 시스템, 일부 정부기관 시스템, 오래된 윈도우 환경에서 여전히 사용됩니다. EUC-KR은 지원하는 한글 문자가 한정되어 있어 일부 특수 한글 문자는 표현하지 못할 수 있습니다.
UTF-16 (유니코드)
UTF-16은 자바(Java), 윈도우 내부 처리, 자바스크립트 문자열 내부 처리 방식입니다. 대부분의 문자를 2바이트로 처리하지만, 이모지처럼 기본 다국어 평면(BMP)을 벗어나는 문자는 4바이트 서로게이트 쌍으로 처리합니다.
바이트 계산기가 필요한 상황
데이터베이스 컬럼 설계
MySQL에서 VARCHAR(255)는 255바이트가 아닌 255글자를 저장합니다. 단, utf8mb4 인코딩 설정에서는 한 글자가 최대 4바이트이므로, 실제 인덱스 크기에 제한이 생길 수 있습니다. 게시판 제목, 닉네임, 주소 등의 컬럼 크기를 설계할 때 바이트 수 확인이 필수입니다.
SMS·LMS 문자 메시지
SMS는 영문 160자, 한글 70자가 기본 단문 한도입니다. 한글이 EUC-KR 기준 2바이트이므로 140바이트 내에서 70글자를 전송할 수 있습니다. 초과 시 LMS(장문 메시지)로 전환되며 요금이 달라집니다. 문자 마케팅을 기획할 때 글자수와 바이트를 동시에 확인해야 비용을 절감할 수 있습니다.
카카오톡 · SNS 글자 제한
카카오톡 메시지는 한 번에 최대 10,000자, 카카오 비즈니스 메시지(알림톡)는 최대 1,000자로 제한됩니다. 트위터(X)는 140자(현재 280자), 인스타그램 캡션은 2,200자가 한도입니다. SNS 마케팅 콘텐츠를 작성할 때 글자 제한 내에서 최대한 정보를 전달하려면 글자수 계산이 필수입니다.
프로그래밍 및 API 개발
REST API에서 요청 파라미터 길이, 구글·네이버 API의 텍스트 분석 한도, OpenAI GPT 토큰 계산 등에서도 글자수와 바이트 수가 중요합니다. 특히 네이버 CLOVA API는 요청당 최대 5,000바이트 제한이 있으며, 이를 초과하면 에러가 발생합니다.
글자수 계산기 vs 바이트 계산기
단순 글자수 계산기는 문자를 1개씩 세는 반면, 바이트 계산기는 각 문자의 실제 저장 크기를 계산합니다. 워드 프로세서의 글자수와 데이터베이스의 바이트 한도는 다른 개념이므로, 정확한 데이터 처리가 필요한 경우 반드시 바이트 기준으로 확인해야 합니다.
올바른 인코딩 기준 선택 방법
- 웹 개발 / MySQL / API → UTF-8 선택
- 레거시 한국 시스템 / 구형 DB → EUC-KR 선택
- Java / Windows 내부 / JS 문자열 → UTF-16 선택
- SMS 문자 메시지 → EUC-KR 선택 (한글 2바이트 기준)
- 일반적인 글자수 확인 → 글자수(Character) 기준 사용
자주 묻는 질문 (FAQ)
한글 한 글자는 몇 바이트인가요?
인코딩 방식에 따라 다릅니다. UTF-8에서는 3바이트, EUC-KR에서는 2바이트, UTF-16에서는 2바이트입니다. 웹사이트와 현대 애플리케이션 대부분은 UTF-8을 사용하므로 한글 1글자 = 3바이트로 이해하면 됩니다.
공백(스페이스)도 바이트를 차지하나요?
네, 공백도 문자입니다. ASCII 공백(스페이스 키)은 UTF-8 기준 1바이트를 차지합니다. 줄바꿈(엔터)도 1~2바이트를 차지합니다(OS에 따라 다름).
이모지는 몇 바이트인가요?
대부분의 이모지는 UTF-8 기준 4바이트를 차지합니다. 이모지가 포함된 메시지나 데이터베이스 컬럼 설계 시 반드시 utf8mb4 인코딩을 사용해야 하며, utf8(3바이트 한도)에서는 이모지가 저장되지 않습니다.
네이버 SEO 메타설명 적정 바이트는?
네이버 메타설명(meta description)은 80자 내외(약 160~240바이트)가 검색결과에 표시되는 최적 길이입니다. 구글은 160자(영문 기준)를 권장하며, 한글 기준으로는 약 80~90자 수준입니다. 본 바이트 계산기의 제한 바 기능을 활용해 메타설명을 최적 길이로 작성해 보세요.