এইচটিএমএল URL এনকোড - HTML URL Encode


ওয়েব এড্রেসের একটি নাম হল ইউআরএল (URL) এবং URL এর পূর্ণরূপ হল Uniform Resource Locator.

একটি URL হতে পারে একটি নাম যেমন www.websschool.com অথবা একটি আইপি(IP) এড্রেস যেমন 66.165.226.242 অধিকাংশ ইউজারই ওয়েব সার্ফিং করার সময় URL হিসেবে ওয়েব সাইট এর নাম ব্যবহার করে কারন কতগুলো সংখ্যা মনে রাখার তুলনায় কোন নাম মনে রাখা অনেকটাই সহজ।


URL

কোন এইচটিএমএল পেজের একটি লিংকে যখন আপনি ক্লিক করেন তখন একটি <a> ট্যাগ আপনাকে ইন্টারনেটের কোন নির্দিষ্ট ওয়েব পেজে নিয়ে যায়।
ইন্টারনেটে কোন ডকুমেন্ট বা অন্য কোন তথ্য বা Data কে এড্রেসিং করতে URL ব্যাবহৃত হয়।
এ রকম দেখতে একটি ওয়েব এড্রেস http://www.webssool.com/html/html-4.01-home.html, নীচের নিয়ম অনুসরন করে -

সিনট্যাক্স

scheme://host.domain:port/path/filename
 

scheme - এটি কোন ধরনের ইন্টারনেট সার্ভিস তা নির্দেশ করে। সবচেয়ে জনপ্রিয় scheme হল http এবং https,
host - এটি নির্দেশ করে কোন ধরনের ডোমেইন হোসট ( Domain Host), এর ডিফল্ট domain host হল www.
domain - এটি ওয়েব সাইট এর নিবন্ধিত ডোমেইন নাম নির্দেশ করে, যেমন websschool.com
port - এটি host এর পোর্ট নাম্বার নির্দেশ করে, http এর জন্য ডিফল্ট পোর্ট নাম্বার হল ৮০
path - সার্ভারে সংরক্ষিত ডকুমেন্টের পথ বা অবস্থান নির্দেশ করে।
filename - কোন ডকুমেন্ট বা file এর নাম নির্দেশ করে।


প্রচলিত সাধারন URL পদ্ধতি

নিচের টেবিলে কিছু সাধারণ পদ্ধতি প্রদর্শন করা হল।

পদ্ধতি বিশদ নাম ব্যবহার
http HyperText Transfer Protocol এটা একটি সাধারণ ওয়েব পেজ বোঝায়। এটি ইনক্রিপ্টেড নয়
https Secure HyperText Transfer Protocol এটা সংরক্ষিত ওয়েব পেজ বোঝায়। এটি ইনক্রিপ্টেড
ftp File Transfer Protocol এটা ডাউনলোডিং অথবা আপলোডিং ফাইল বোঝায়।
file   এটা কম্পিউটারের একটি ফাইল বোঝায়।


URL এনকোডিং

শুধুমাত্র ASCII ক্যারেক্টার-সেট ব্যবহারের মাধ্যমে কোন URL কে ইন্টারনেটে পাঠানো যায়।

যদি ASCII সেট ভিন্ন কোন প্রকার ক্যারেক্টার URL-এ ব্যবহার করা হয় তখন তাকে অবশ্যই কনভার্ট করতে হয়। URL এনকোডিং দ্বারা ASCII ক্যারেক্টার সেটের বাইরের ক্যারেক্টার গুলোকে কনভার্ট করে ইন্টারনেটের মাধ্যমে পাঠানো হয়।

URL এনকোডিং এ ASCII ক্যারেক্টার সেটের বাইরের ক্যারেক্টার গুলোকে একটি "%" এবং হেক্সাডেসিমেল সংখ্যা দিয়ে প্রতিস্থাপন করে থাকে। এই URL-এর মধ্যে ফাকাস্থান বা space ব্যবহার করা যায় না। এক্ষেত্রে URL এনকোডিং পদ্ধতি ফাকাস্থান বা space গুলোকে '+' চিহ্ন অথবা %20 তে রূপান্তরিত করে থাকে।


ASCII এনকোডিং

ওয়েব পেজে ব্যবহৃত ক্যারেক্টার সেট অনুযায়ী ওয়েব ব্রাউজার ইনপুট এনকোড করএ থাকে। এইচটিএমএল ৫.০ এ পূর্ব-নির্ধারিত বা default ক্যারেক্টার সেট হল UTF-8।

ক্যারেক্টার Windows-1252 UTF-8
%80 %E2%82%AC
£ %A3 %C2%A3
© %A9 %C2%A9
® %AE %C2%AE
À %C0 %C3%80
Á %C1 %C3%81
 %C2 %C3%82
à %C3 %C3%83
Ä %C4 %C3%84
Å %C5 %C3%85

এইচটিএমএল ক্যারেক্টার সেট সম্পর্কে জানতে Wikipedia এর List of XML and HTML character entity references ওয়েব পেজটি ব্রাউজ করুন।