HTML Encoding (Character Sets)
📚 HTML Encoding (کدگذاری کاراکترها)
1. چرا کدگذاری کاراکترها مهم است؟
هر صفحه وب شامل متنهایی است که ممکن است حروف، اعداد و نمادهای خاص مثل فارسی، عربی، چینی یا نمادهای ریاضی و … را شامل شود.
کدگذاری تعیین میکند که این کاراکترها چگونه به صورت باینری (اعداد صفر و یک) ذخیره و منتقل شوند.
بدون کدگذاری درست، متن صفحه به صورت ناخوانا یا کاراکترهای عجیب ظاهر میشود (مثلاً علامت سؤال یا مربع سیاه).
2. رایجترین نوع کدگذاری: UTF-8
-
استاندارد جهانی برای وب
-
پشتیبانی از تقریباً تمام زبانها و نمادهای دنیا
-
فشرده و بهینه
-
مرورگرها و سرورها آن را به خوبی پشتیبانی میکنند
3. تعیین کدگذاری در HTML
برای مشخص کردن کدگذاری باید در بخش <head> سند HTML، تگ متا زیر را قرار دهید:
این به مرورگر میگوید که صفحه با UTF-8 رمزنگاری شده و باید کاراکترها را طبق این استاندارد بخواند.
4. سایر کدگذاریها (کمتر استفاده میشوند)
| کدگذاری | توضیح | کاربرد |
|---|---|---|
| ISO-8859-1 | کدگذاری لاتین غربی | برای زبانهای اروپایی غربی |
| Windows-1256 | کدگذاری عربی | برای زبانهای عربی و فارسی در ویندوز |
| Shift_JIS | کدگذاری ژاپنی | مخصوص زبان ژاپنی |
اما توصیه میشود همیشه از UTF-8 استفاده کنید مگر در موارد خاص.
5. نمونه کامل استفاده از UTF-8 در HTML
<!DOCTYPE html>
<html lang=“fa”>
<head>
<meta charset=“UTF-8”>
<title>نمونه صفحه با UTF-8</title>
</head>
<body>
<p>سلام دنیا! این یک متن فارسی است.</p>
</body>
</html>
6. نکات مهم
-
اگر فایل HTML را با ادیتوری ذخیره میکنید، مطمئن شوید با UTF-8 ذخیره شده باشد.
-
در سرورهای وب نیز باید تنظیمات کدگذاری به درستی انجام شود (معمولاً از UTF-8 استفاده میکنند).
-
وقتی دادهای از سمت سرور به مرورگر میآید، هدر HTTP باید کدگذاری را مشخص کند:
Content-Type: text/html; charset=UTF-8
7. خلاصه
| مرحله | کار انجام شده |
|---|---|
| تعیین charset در HTML | <meta charset="UTF-8"> |
| ذخیره فایل | با انکودینگ UTF-8 |
| تنظیم سرور | ارسال هدر Content-Type با UTF-8 |
دیدگاهتان را بنویسید