زبان نشانه‌گذاری

مثالی از ویرایشگر مارک‌داون با متن فارسی

زبان نشانه‌گذاری (به انگلیسی: Markup Language) نوعی زبان توصیفی است که متن و اطلاعات اضافه دربارهٔ متن را با هم ادغام می‌کند. این عبارت در واژگان رایانه و وب معمولاً به یک شبه‌زبان برنامه‌نویسی گفته می‌شود. اطلاعات اضافه‌ای که یک زبان نشانه‌گذاری در نظر می‌گیرد به وسیلهٔ نوعی نشانه‌گذاری توصیف می‌شود و در بین متن قرار می‌گیرد و در نهایت در زمان نمایش یا چاپ، این اطلاعات برای نحوهٔ نمایش متن اصلی و عناصر دیگر موجود در سند استفاده می‌گردد. زبان نشانه‌گذاری یک سیستم رمزگذاری متن است و متشکل از مجموعه‌ای از نمادها است که در یک پرونده نوشتاری برای کنترل ساختار، قالب‌بندی یا رابطه بین بخش‌های آن درج می‌شود.

اِچ. تی. اِم. اِل یا «زبان نشانه‌گذاری فوق متن» یکی از معروفترین زبان‌های نشانه‌گذاری امروزی و یکی از بنیانهای اصلی وب است. هر صفحه موجود در وب با این زبان نوشته و نمایش داده می‌شود. این زبان مورد استفاده برای سندهای وب جهانی است. اچ‌تی‌ام‌ال شکلی از اس‌جی‌ام‌ال (به انگلیسی: SGML) است که از تگ‌ها برای نشانه‌گذاری عناصری چون متن و گرافیک استفاده می‌کند تا برای مرورگرهای وب مشخص شود که این عناصر را چگونه برای کاربر نمایش دهند و به عملیاتی چون فعال کردن یک پیوند از طریق فشردن یک کلید یا دکمهٔ موشی چگونه پاسخ دهند.[۱][۲]

به شکل تاریخی نشانه‌گذاری در صنعت چاپ برای یکسان‌سازی شیوهٔ توصیف اسناد بین نویسندگان، ویرایشگران و مسئولان چاپ استفاده می‌شده‌است. امروزه نیز از این روش به شکل رایانه‌ای (و کمتر به شکل دستی) استفاده می‌شود.

یک زبان نشانه گذاری، یک زبان ساختگی است که با استفاده از یک مجموعه از حاشیه نویس‌های متن که دستورهایی را در مورد ساختار متن یا چگونگی نمایش آن ارائه می‌دهد. زبان‌های نشانه‌گذاری برای قرن‌ها در حال استفاده بوده‌اند و در سالهای اخیر در رایانه‌ها در سیستم‌های حروف‌چینی و پردازش واژه‌ها استفاده شده‌اند.

انواع

سه دسته‌بندی عمومی نشانه‌گذاری الکترونیکی به شرح زیر است:[۳][۴]

نشانه‌گذاری نمایشی

نوعی از نشانه‌گذاری که توسط سامانه‌های کلمه‌پرداز قدیمی استفاده می‌شدند؛ کدهای باینری که در متن‌هایی جاسازی می‌شدند تا تأثیر دریافت عین مشاهده (ویزیویگ) را داشته باشند. این نوع نشانه‌گذاری معمول‍اً از دید کاربرهای حقیقی، حتی نویسندگان و ویرایشگران، پنهان است.

نشانه‌گذاری رویه‌ای

نشانه‌گذاری در متن جای‌گذاری می‌شود و دستورالعملی برای برنامه‌هایی که متن را پردازش می‌کنند، فراهم می‌کند. نمونه‌های شناخته‌شدهٔ این نوع نشانه‌گذاری، شامل تک (نرم‌افزار) و پست‌اسکریپت می‌شود. انتظار می‌رود تا پردازشگر متن را از ابتدا تا انتها، طبق دستورالعملی که با آن مواجه می‌شود اجرا کند. متن با این نوع نشانه‌گذاری، اغلب به‌طور مستقیم توسط نویسنده دست‌کاری می‌شود. سامانه‌های معروف نشانه‌گذاری رویه‌ای، معمول‍اً سازنده‌های برنامه‌نویسی را در بر می‌گیرند، به همین علت ماکروها و زیررویه‌ها می‌توانند به وسیلهٔ نام، تعریف یا استناد داده شوند.

نشانه‌گذاری توصیفی

درحقیقت، انواع مختلف نشانه‌گذاری تفاوت فاحشی با یک‌دیگر ندارند. در سامانه‌های جدید پردازش کلمه، نشانه‌گذاری نمایشی اغلب در سامانه‌های نشانه‌گذاری توصیفی‌محور مانند اکس‌ام‌ال ذخیره می‌شود و سپس به شکل رویه‌ای و با پیاده‌سازی پردازش می‌شود. ساختارهای برنامه‌نویسی در سامانه‌های نشانه‌گذاری رویه‌ای مانند تک (TeX) ممکن است برای ساخت سامانه‌های سطح بال‍اتر نشانه‌گذاری که بیشتر توصیفی هستند؛ مانند لاتک، استفاده شوند.[۵]

امکانات

کد منبع HTML تصویر توسط درک جنسن (Tysto)، 2006-ژانویه-1

یک امکان رایج اغلب زبان‌های نشانه‌گذاری؛ این است که آن‌ها متن یک مستند را با دستورالعمل‌های نشانه‌ای در یک جریان داده یا فایل یک‌سان، ترکیب می‌کنند. این‌کار الزامی نیست، در واقع این ممکن است که نشانه‌گذاری را از محتوای متنی به وسیلهٔ نشانه‌گرها؛ افست‌ها و IDها، جداسازی کرد.

<h1>Anatidae</h1>
<p>
The family <i>Anatidae</i> includes ducks, geese, and swans,
but <em>not</em> the closely related screamers.
</p>

کدهایی که در بین دوعل‍امت کوچک‌تر و بزرگ‌تر محصور شده‌اند (مثل <این>)؛ دستورالعمل‌های نشانه‌گذاری هستند که به «تگ» شناخته می‌شوند. درحالی که متن بین این دستورالعمل‌ها در واقع عین متن مستند هستند. کدهای h1، p و em مثال‌هایی از نشانه‌گذاری معنایی هستند که معنی و منظور متنی را که شامل می‌شوند را منتقل می‌کنند. h1، به معنای عنوان سطح اول؛ p به معنای پاراگراف و em به معنای کلمه یا عبارت تأکید شده‌است. برنامه‌ای که چنین نشانه‌گذاری را تفسیر می‌کند، ممکن است قواعد و سبک خود را برای نشان دادن بخش‌های مختلف متن با استفاده از فونت‌های مختلف، ضخامت‌ها، ابعاد مختلف، رنگ‌ها یا سایر سبک‌ها اعمال کند. یک تگ با عنوان «h1» ممکن است با یک فونت بزرگ و به‌خصوص نمایش داده شود، یا با هر سبک و اندازهٔ دیگری نشان داده شود یا حتی تغییری با سایر اجزای متن نداشته باشد. درعوض، تگ i در اچ‌تی‌ام‌ال مثالی از نشانه‌گذاری نمایشی‌ست که برای مشخص‌کردن یک ویژگی خاص متن (در اینجا استفادهٔ فونت ایتالیک) بدون ذکر دلیل استفاده می‌شود.

استفاده‌های جایگزین

از آن‌جا که ایدهٔ استفاده از زبان نشانه‌گذاری، از مستندات متنی نشأت گرفته‌است، استفاده از زبان نشانه‌گذاری در نشان‌دادن و ارائهٔ سایر انواع اطل‍اعات مانند گرافیک برداری، خدمات وب و واسط کاربر در حال افزایش است. بیشتر این مثال‌ها؛ برنامه‌های اکس‌ام‌ال هستند، به این جهت که اکس‌ام‌ال یک زبان گسترده‌است و در عین حال به خوبی تعریف شده‌است.[۶]

از آنجا که زبان‌های نشانه‌گذاری و اغلب زبان‌های توصیف‌گر داده‌ای، زبان‌های برنامه‌نویسی نیستند[۷] و درحقیقت داده‌هایی بدون دستورالعمل‌ها هستند، نسبت به زبان‌های برنامه‌نویسی راحت‌تر دستکاری می‌شوند. برای مثال، صفحات وب به صورت مستندات اچ‌تی‌ام‌ال نمایش داده می‌شوند و نه کدهای C. به همین علت است که می‌توانند در سایر صفحات وب جای‌گذاری شوند، یا حتی درصورتی که قسمتی از آن‌ها بارگیری شود، باز هم نمایش داده می‌شوند.

جستارهای وابسته

منابع

  1. "First mention of HTML Tags on the www-talk mailing list". World Wide Web Consortium. October 29, 1991. Retrieved April 8, 2007.
  2. "Index of elements in HTML 4". World Wide Web Consortium. December 24, 1999. Retrieved April 8, 2007.
  3. Coombs, James H.; Renear, Allen H.; DeRose, Steven J. (November 1987). "Markup systems and the future of scholarly text processing". Communications of the ACM. ACM. 30 (11): 933–947. doi:10.1145/32206.32209.
  4. Bray, Tim (9 April 2003). "On Semantics and Markup, Taxonomy of Markup". www.tbray.org/ongoing. Retrieved 9 July 2015.
  5. Michael Downes. "TEX and LATEX 2e"
  6. An XHTML + MathML + SVG Profile". W3C, August 9, 2002. Retrieved on 17 March 2007.
  7. Jukka Korpela (۲۰۰۵-۱۱-۱۶). «Programs vs. markup». بایگانی‌شده از اصلی در ۲۲ ژانویه ۲۰۱۱. دریافت‌شده در ۲ ژوئن ۲۰۱۷.