W3C5 HTML ¹®¼­ Ç¥ÇöTrio ȨÆäÀÌÁö
¸ñÂ÷
  1. ¹®¼­ ±ÛÀÚ ¼¼Æ®
  2. ±ÛÀÚ ¿£ÄÚµù(encoding)
    1. ¿£ÄÚµù ¼±ÅÃ
    2. ±ÛÀÚ ¿£ÄÚµù ÁöÁ¤
  3. ±ÛÀÚ ÂüÁ¶
    1. ¼öÄ¡ ±ÛÀÚ ÂüÁ¶
    2. ±ÛÀÚ ¿£Æ¼Æ¼(entity) ÂüÁ¶
  4. Ç¥Çö ÇÒ ¼ö ¾ø´Â ±ÛÀÚ

¿©±â¼­´Â ¹®¼­°¡ ÄÄÇ»ÅÍ¿Í ÀÎÅͳݿ¡¼­ ¾î¶»°Ô Ç¥ÇöµÇ´Â°¡¸¦ ¾Ë¾Æº»´Ù.

¹®¼­ ±ÛÀÚ ¼¼Æ®¿¡¼­´Â HTML ¹®¼­¿¡ Æ÷ÇÔ µÉ ¼ö ÀÖ´Â ±ÛÀÚ¸¦ ¹ßÃéÇÏ´Â ¹®Á¦¸¦ ´Ù·é´Ù. ±ÛÀÚ¿¡´Â ¶óƾ¾î(Latin) "A", ½Ã¸±¾î(Cyrillic) "I", Áß±¹¾î "â©" ±ÛÀÚ µîÀÌ ÀÖ´Ù.

±ÛÀÚ ¿£ÄÚµù Ç׸ñ¿¡¼­´Â ÀÌµé ±ÛÀÚ°¡ È­ÀÏÀ̳ª ÀÎÅͳÝÀ» ÅëÇØ ¼Û½ÅµÇ¸é, ¾î¶»°Ô Ç¥Çö(represented)µÇ´Â°¡¸¦ ´Ù·ð´Ù. ¾î¶² ±ÛÀÚ ¿£ÄÚµùÀº Á÷Á¢ ÇÒ ¼ö ¾ø´Â °æ¿ì°¡ Àֱ⠶§¹®¿¡, Á¦ÀÛÀÚ°¡ ¹®¼­¿¡ Æ÷ÇÔ½ÃÅ°´Â ¸ðµç ±ÛÀÚ¸¦ Ç¥ÇöÇϱâ À§Çϼ­ HTMLÀº ±ÛÀÚ ÂüÁ¶¶ó´Â ±â´ÉÀ» Á¦°øÇÑ´Ù.

Àΰ£ ¾ð¾îµé¿¡´Â ´ë´ÜÈ÷ ¸¹Àº ±ÛÀÚµéÀÌ ÀÖ°í, ±× ±ÛÀÚµéÀÇ Ç¥Çö ¹æ½Äµµ ¿©·¯°¡Áö°¡ ÀÖÀ¸¹Ç·Î, Àü ¼¼°èÀÇ »ç¿ëµµ±¸µéÀÌ ÀÌÇØ ÇÒ ¼ö ÀÖµµ·Ï Àû´çÇÑ ¹è·Á°¡ ÀÖ¾î¾ß ÇÑ´Ù.

5.1 ¹®¼­ ±ÛÀÚ ¼¼Æ®

¿ø°Å¸®¿¡ ³Î¸® Åë¿ëµÇ±â À§ÇÏ¿© HTML¸¦ Æ÷ÇÔ ÇÑ °¢ SGMLÀº Àû¿ë ÇÒ ¹®¼­ ±ÛÀÚ ¼¼Æ®(document character set)¸¦ ÁöÁ¤ ÇÒ ÇÊ¿ä°¡ ÀÖ´Ù.

HTML ¹®¼­¸¦ Æ÷ÇÔ ÇÑ °¢ SGML ¹®¼­´Â ·¹ÆÄÅ丮¿¡ ÀÖ´Â ±ÛÀÚµéÀÌ ¿¬¼Ó µÈ °ÍÀÌ´Ù. ÄÄÇ»ÅÍ ½Ã½ºÅÛÀº °¢ ±ÛÀÚ¸¦ Äڵ忡¼­ÀÇ ±ÛÀÚ À§Ä¡·Î ÀνÄÇÑ´Ù. ¿¹¸¦ µé¸é ASCII(¾Æ½ºÅ°) ±ÛÀÚ ¼¼Æ®¿¡¼­ Äڵ忡¼­ÀÇ ±ÛÀÚ À§Ä¡ 65, 66°ú 67Àº °¢°¢ ±ÛÀÚ 'A', 'B', ¿Í 'C'¸¦ ³ª´Ù³½´Ù.

ASCII ±ÛÀÚ ¼¼Æ®´Â À¥°ú °°Àº Àü ¼¼°èÀûÀÎ Á¤º¸ ½Ã½ºÅÛ¿¡¼­´Â ÃæºÐÇÏÁö ¸øÇϹǷΠHTMLÀº ¼¼°èÀû ¼¼Æ® ±ÛÀÚ(UCS: Universal Character Set[ISO10646])¶ó´Â ÈνŠ´õ ¿ÏÀüÇÑ ±ÛÀÚ ¼¼Æ®¸¦ »ç¿ëÇÑ´Ù. ÀÌ Ç¥ÁØÀº Àü ¼¼°è¿¡¼­ »ç¿ëµÇ´Â ¼ö õ ±ÛÀÚÀÇ ·¹ÆÄÅ丮(repertoire)¸¦ °®´Â´Ù.

ÀÌ [ISO10646]¿¡¼­ Á¤ÀÇ µÈ ±ÛÀÚ ¼¼Æ®´Â Unicode[UNICODE]¿¡ ¸Â°Ô ±ÛÀÚ º°·Î Á¤ÀǵǾîÀÖ´Ù. ÀÌ µÎ Ç¥ÁØÀº ¶§¶§·Î »õ·Î¿î ±ÛÀÚ¸¦ Ãß°¡Çϸ鼭 ¾÷µ¥ÀÌÆ®µÇ´Âµ¥ ÇØ´ç À¥ ½ÎÀÌÆ®¿¡¼­ Á¶È¸ ÇÒ ¼ö ÀÖ´Ù. ÇöÀçÀÇ ±Ô°Ý¿¡¼­ ISO-10646Àº À¯´ÏÄÚµå(Unicode)¿Í °°Àº ¹®¼­ ±ÛÀÚ ¼¼Æ®¸¦ ÀǹÌÇÏÁö¸¸, À¯´ÏÄÚµå ±Ô°Ý¿¡´Â ¾ç¹æÇâ ÅؽºÆ® ±â´Éµµ Á¶È¸ÇÑ´Ù.

±×·¯³ª ¹®¼­ ±ÛÀÚ ¼¼Æ®´Â È­ÀÏÀ̳ª ³×Æ®¿ö±× ¼Û½Å¿¡¼­ ÀÏ·ÃÀÇ ¹ÙÀÌÆ®µéÀ» ¿£ÄÚµùÇÏ´Â »ç¿ëµµ±¸¿¡¼­´Â, HTML ¹®¼­¸¦ ¹Ù¸£°Ô Ç¥ÇöÇϴµ¥ ÃæºÐÇÏÁö ¸øÇÏ´Ù. »ç¿ëµµ±¸´Â ¹®¼­ ±ÛÀÚ È帧À» ¹ÙÀÌÆ® È帧À¸·Î º¯È¯ÇÏ´Â ±ÛÀÚ ¿£ÄÚµùµµ ÀÌÇØ ÇؾßÇÑ´Ù.

5.2 ±ÛÀÚ ¿£ÄÚµù

ÀÌ ±Ô°Ý¿¡¼­ ±ÛÀÚ ¿£ÄÚµù(character encoding)À¸·Î ºÒ¸®¿ì´Â °ÍÀÌ Å¸ ±Ô°Ý¿¡¼­ ´Ù¸¥ À̸§À¸·Î ¾Ë·ÁÁ® Àֱ⵵ ÇÏ¿© È¥µ¿À» ÀÏÀ¸Å³ ¼öµµ ÀÖ´Ù. ±×·¯³ª ±× °³³äÀº ÀÎÅͳݿ¡¼­ °ÅÀÇ °°´Ù. ¶Ç ÇÑ ÇÁ·ÎÅäÄÝ Çì´õ(protocol header), ¾ÖÆ®¸®ºäÆ®¿Í ÆĶó¸ÞÅ͵µ ±ÛÀÚ ¿£ÄÚµù "charset"À̶ó´Â °°Àº À̸§À» »ç¿ëÇÏ°í, [IANA] µî·Ï(registry)¿¡¼­ °¡Á® ¿Â °ªµµ ±×·¸´Ù. ¿ÏÀü ÇÑ ¸ñ·ÏÀº [CHARSETS] ÂüÁ¶Ç϶ó.

"charset" ÆĶó¸ÞÅÍ´Â ±ÛÀÚ ¿£ÄÚµùÀ» ÁöÁ¤ÇÏ´Â °ÍÀ¸·Î, ÀÏ·ÃÀÇ ¹ÙÀÌÆ® È帧À» ÀÏ·ÃÀÇ ±ÛÀÚ È帧À¸·Î º¯È¯ ÇÏ´Â ÇÑ°¡Áö ¹æ¹ýÀÌ´Ù. ¹°·Ð ÀÌ º¯È¯Àº À¥ÀÇ ÀÛ¿ë¿¡ ÀûÇÕÇѵ¥, ¼­¹öµéÀº ÀÏ·ÃÀÇ ¹ÙÀÌÆ® È帧À¸·Î »ç¿ëµµ±¸¿¡°Ô HTML ¹®¼­¸¦ º¸³»°í, »ç¿ëµµ±¸µéÀº ÀÌ°ÍÀ» ÀÏ·ÃÀÇ ¹®ÀÚ È帧À¸·Î Çؼ®ÇÑ´Ù. ±× º¯È¯ ¹æ¹ýÀº ´Ü¼øÇÑ ÀÏ ´ë ÀÏ Åë½Å¿¡¼­ ºÎÅÍ º¹ÀâÇÑ ½ºÀ§Äª ¹æ½Ä/±â´É(switching scheme or algorithm) ±îÁö ÀÖ´Ù.

[ISO10646]¿Í °°ÀÌ ¹®ÀÚ°¡ ¸¹À¸¸é, ´Ü¼øÇÑ ÇÑ-±ÛÀÚ´ç-ÇÑ-¹ÙÀÌÆ® ¿£ÄÚµù ±â¼ú·Î´Â ±ÛÀÚ ·¹ÆÄÅ丮(repertoire)·Î ¹®ÀÚ¿­À» ó¸®ÇÏ´Â µ¥ ÇÑ°è°¡ ÀÖ´Ù. [ISO10646]¿¡´Â UCS-4¿Í °°Àº ¸î °¡Áö ´Ù¸¥ ¿£ÄÚµù ¹æ½ÄÀÌ Àüü ±ÛÀÚ ¼¼Æ®¿¡ Ãß°¡µÇ¾î ÀÖ´Ù.

5.2.1 ¿£ÄÚµù ¼±ÅÃ

¹®¼­ ÀÛ¼º±â¿Í °°Àº ÆíÁý±âµéÀº ¼±Åà µÈ ±ÛÀÚ ¿£ÄÚµù ¹æ½ÄÀ¸·Î HTML ¹®¼­¸¦ ¿£ÄÚµùÇϸç, ±× ¼±ÅÃÀº ¼ÒÇÁÆ®¿þ¾î¿¡ »ç¿ë µÈ ¹æ¹ý¿¡ µû¶ó Å©°Ô Á¿ìµÈ´Ù. ÀÌµé µµ±¸µéÀº ¼­·ù¿¡ Æ÷ÇÔ µÈ ´ëºÎºÐÀÇ ±ÛÀÚ¸¦ Æ÷ÇÔÇÏ´Â ¾î¶² Æí¸®ÇÑ ¿£ÄÚµù ¹æ¹ýµµ ä¿ë ÇÒ ¼ö Àִµ¥, ÀÌ´Â ¿Ã¹Ù¸¥ ¿£ÄÚµùµÇ¾ú´Ù´Â ÀüÁ¦¿¡¼­ ±×·¸´Ù. °£È¤ ³ªÅ¸³ª´Â ÀÌ ¿£ÄÚµù¿¡ Æ÷ÇÔµÇÁö ¾Ê´Â ±ÛÀÚ´Â ¿©ÀüÈ÷ ±ÛÀÚ ÂüÁ¶¸¦ Àû¿ë ÇÒ ¼ö ÀÖ´Ù. À̵éÀº ±ÛÀÚ ¿£ÄÚµùÀ» ÂüÁ¶ÇÏÁö ¾Ê°í Ç×»ó ¹®¼­ ±ÛÀÚ ¼¼Æ®¸¦ ÂüÁ¶ÇÑ´Ù.

¼­¹ö¿Í ÇÁ·Ï½Ã(proxy)µéÀº »ç¿ëµµ±¸ÀÇ ¿äû¿¡ µû¶ó ±ÛÀÚ ¿£ÄÚµùÀ» º¯°æ ÇÒ ¼ö Àִµ¥, À̸¦ Æ®·£½º ÄÚµù(transcoding)À̶ó ÇÑ´Ù. [RFC2068], HTTP Çì´õ ¿äû¿¡ µû¶ó ¹Þ¾Æ µéÀÌ´Â ±ÛÀÚ ¼¼Æ®, Ç׸ñ 14.2¸¦ ÂüÁ¶Ç϶ó. ¼­¹ö¿Í ÇÁ·Ï½Ã(proxy)µéÀº ¸ðµç ¹®¼­ ±ÛÀÚ ¼¼Æ®¸¦ Ä¿¹öÇÏ´Â ±ÛÀÚ ¿£ÄÚµùÀ» Á¦°øÇØ¾ß ÇÏ´Â °ÍÀº ¾Æ´Ï´Ù.

À¥¿¡¼­ º¸ÆíÀûÀ¸·Î »ç¿ëµÇ´Â ±ÛÀÚ ¿£ÄÚµùÀº ´ÙÀ½ »çÇ×À» Æ÷ÇÔÇÑ´Ù.

  1. ISO-8859-1: "Latin-1": ´ëºÎºÐÀÇ ¼­À¯·´ ¾ð¾î¿¡ »ç¿ë °¡´É
  2. ISO-8859-5: "Cyrillic"
  3. SHIFT_JIS: ÀϺ»¾î
  4. EUC-JP: ´Ù¸¥ ÀϺ»¾î ¿£ÄÚµù
  5. UTF-8: ´Ù¸¥ ¹ÙÀÌÆ® ¼ö¸¦ »ç¿ëÇÏ´Â ISO 10646 ¿£ÄÚµù
±ÛÀÚ ¿£ÄÚµù À̸§Àº "SHIFT_JIS", "Shift_JIS"¿Í "shift_jis" µî°ú °°ÀÌ ´ë¼Ò¹®ÀÚ ±¸º° ¾øÀÌ »ç¿ëµÈ´Ù.

ÀÌ ±Ô°Ý¿¡¼­ »ç¿ëµµ±¸°¡ ¾î¶² ±ÛÀÚ ¿£ÄÚµùÀ» »ç¿ë ÇؾßÇÑ´Ù´Â °­Á¦¼ºÀº ¾ø´Ù.

±Ô°Ý¿¡ ºÎÇÕÇÏ´Â »ç¿ëµµ±¸´Â ¾î¶² ±ÛÀÚ ¿£ÄÚµù¸¦ »ç¿ëÇÏ´ø Unicode¿¡ ¸Âµµ·Ï ¸ðµç ±ÛÀÚ¸¦ ¹èÄ¡ÇÏ¿©¾ß È÷¸ç ÃÖ¼ÒÇÑ ±×·¸°Ô ÀÛµ¿¾ß¿©¾ß ÇÑ´Ù.

ƯÁ¤ ¿£ÄÚµù¿¡ ´ëÇÑ ÁÖ¼®

HTML ¹®ÀåÀÌ UTF-16(charset=UTF-16)·Î ¼Û½Å µÉ ¶§, [ISO10646 Ç׸ñ 6.3]¿Í [UNICODE C3Àý ÆäÀÌÁö 3-1]¿¡ µû¶ó, ¹®ÀåÀº ³×Æ®¿öÅ© ¹ÙÀÌÆ® ¼ø¼­(Å« endian, ³ôÀº ¼ø¼­ ¹ÙÀÌÆ® ¸ÕÀú)·Î ¼Û½ÅµÇ¾î¾ß ÇÑ´Ù.

¶Ç ÇÑ ÀûÀýÈ÷ Ç¥ÇöµÇ´Â ±âȸ¸¦ ±Ø´ëÈ­Çϱâ À§ÇÏ¿© UTF-16·Î ¼Û½ÅµÇ´Â ¹®¼­´Â Ç×»ó ³Êºñ ¾ø´Â ÁÙ¹Ù²Þ ±ÛÀÚ°¡ ¾Æ´Ñ °ø°£ ±ÛÀÚ(ZERO-WIDTH NON-BREAKING SPACE: 16Áø¼ö FEFF: ¹ÙÀÌÆ® ¼ø¼­ Ç¥½Ã(BOM: Byte Order Mark))·Î ½ÃÀÛÇÒ °ÍÀ» ±ÇÇÏ´Ù. ÀÌ ¹ÙÀÌÆ®°¡ ¿¹¾àµÇ¾î ÀÖÀ¸¸é, ÀÌ 16Áø¼ö FFFE·Î ÁöÁ¤ÇÏ¸é ´Ù¸¥ ±ÛÀÚ·Î ÁöÁ¤µÇÁö ¾ÊÀº ±ÛÀÚ ÀÓÀÌ È®½ÇÇÏ´Ù. »ç¿ëµµ±¸´Â ±×·¡¼­ ¹®ÀåÀÇ Ã¹¹ø° ¹ÙÀÌÆ®¸¦ 16Áø¼ö FFFE·Î ¹ÞÀ¸¸é, ³ª¸ÓÁö ºÎºÐÀÇ ¹®ÀåÀ» À§ÇÑ ¹ÙÀÌÆ®µéÀ» ÁغñÇØ¾ß ÇÑ´Ù´Â °ÍÀ» ¾Ë°ÔµÈ´Ù.

IANA¿¡ ISO-10646-UTF-1·Î µî·Ï µÈ [ISO10646]ÀÇ º¯È¯ ¾ç½Ä UTF-1Àº »ç¿ëµÇÁö ¾Ê¾Æ¾ß ÇÑ´Ù. ISO 8859-8°ú ¾ç¹æÇâ ±â´É¿¡ ´ëÇÑ Ãß°¡ Á¤º¸´Â ¾ç¹æÇ⼺°ú ±ÛÀÚ ¿£ÄÚµùÀ» ÂüÁ¶Ç϶ó.

5.2.2 ±ÛÀÚ ¿£ÄÚµù ÁöÁ¤

¼­¹ö´Â ¹®¼­¸¦ »ç¿ëÇϴµ¥ Àû¿ë ÇÒ ±ÛÀÚ ¿£ÄÚµùÀ» ¾î¶»°Ô °áÁ¤Çϴ°¡? ÀϺΠ¼­¹öµéÀº ¹®¼­ÀÇ ¸Ç ¾ÕÂÊ ¸î ¹ÙÀÌÆ®µéÀ» Á¡°ËÇϰųª, ¶Ç´Â ¾Ë°í ÀÖ´Â È­ÀÏ°ú ¿£ÄÚµù µ¥ÀÌÅͺ£À̽º¿¡ ¸Â´Â°¡¸¦ Á¡°ËÇÑ´Ù. ¸¹Àº ¿À´Ã³¯ ¼­¹öµéÀº ±ÛÀÚ ¼³Á¤¿¡¼­ °ú°Å ¼­¹ö¿¡¼­ º¸´Ù À¥ °ü¸®ÀÚ¿¡°Ô ÁÁÀº °ü¸® ´É·ÂÀ» Á¦°øÇÑ´Ù. À¥ °ü¸®ÀÚ´Â °¡±ÞÀû "charset" ÆĶó¸ÞÅ͸¦ »ç¿ëÇÏ¿©, ÀÌµé ±â´É¿¡ À߸ø µÈ "charset" ÆĶó¸ÞÅÍ °ªÀÌ ÁöÁ¤µÇÁö ¾Êµµ·Ï ÇÏ¿©¾ß ÇÑ´Ù.

»ç¿ëµµ±¸´Â ¾î¶² ±ÛÀÚ ¿£ÄÚµùÀ» »ç¿ë Çߴ°¡¸¦ ¾î¶»°Ô ¾Ë¾Æ³»³ª? ¼­¹ö°¡ ÀÌ Á¤º¸¸¦ Á¦°øÇÏ¿©¾ß ÇÑ´Ù. °¡Àå Á÷Á¢ÀûÀ¸·Î ¼­¹ö°¡ »ç¿ëµµ±¸¿¡°Ô ¹®¼­ÀÇ ±ÛÀÚ ¿£ÄÚµù ¹æ½ÄÀ» ¾Ë·ÁÁÖ´Â ¹æ¹ýÀº HTTP ÇÁ·ÎÅäÄÝ(protocol) ÀÇ "Content-Type"(ÄÁÅÙÆ® ŸÀÔ) Çì´õ¿¡ "charset" ÆĶó¸ÞÅ͸¦ »ç¿ëÇÏ´Â °ÍÀÌ´Ù([RFC2068] 3.4¿Í 14.18 ÂüÁ¶).

HTTP Çì´õ¿¡ EUC-JP·Î ±ÛÀÚ ¿£ÄÚµùÀ» ÁöÁ¤ÇÑ ¿¹Á¦:

 Content-Type: text/html; charset=EUC-JP

text/html Á¤ÀÇ¿¡¼­ ±Ô°Ý¿¡ ºÎÇÕ¼º Ç׸ñÀ» ÂüÁ¶Ç϶ó.

HTTP ÇÁ·ÎÅäÄÝ(protocol: [RFC2068] Ç׸ñ 3.7.1)¿¡¼­´Â "Content-Type" Çì´õ¿¡ "charset" ÆĶó¸ÞÅÍ°¡ ¾øÀ» ¶§ µðÆúÆ®·Î ISO-8859-1 ±ÛÀÚ ¿£ÄÚµùÀ» »ç¿ëÇÑ´Ù°í ¾ð±ÞµÇ¾îÀÖ´Ù. ½ÇÁ¦·Î´Â ÀϺΠ¼­¹öµé¿¡¼­´Â "charset" ÆĶó¸ÞÅ͸¦ Çã¿ëÇÏÁö ¾Ê°í, ´Ù¸¥ ÀϺΠ¼­¹ö¿¡¼­´Â ÆĶó¸ÞÅ͸¦ ¼³Á¤ÇÏ´Â °ÍÀ» Çã¿ëÇÏÀÚ ¾Ê±â ¶§¹®¿¡ »ç¿ë ÇÒ ¼ö ¾ø´Ù. µû¶ó¼­ »ç¿ëµµ±¸´Â "charset" ÆĶó¸ÞÅÍ¿¡ ¾î¶² µðÆúÆ® °ªÀ» °¡Á¤ÇÏÁö ¸»¾Æ¾ß ÇÑ´Ù.

¼­¹ö¿¡ ¾Ë·Á Áְųª ±¸¼ºÀÇ ÇѰ踦 ¼³Á¤Çϱâ À§ÇÏ¿©, HTML ¹®¼­´Â META ¿¤·¹¸àÆ®¸¦ »ç¿ëÇÏ¿© »ç¿ëµµ±¸¿¡°Ô ¹®¼­ÀÇ ±ÛÀÚ ¿£ÄÚµù Á¤º¸¸¦ È®½ÇÈ÷ Áö¸íÀûÀ¸·Î Á¦°ø ÇÒ ¼ö ÀÖ´Ù.

¿¹¸¦ µé¾î, ÇöÀç ¹®¼­ÀÇ ±ÛÀÚ ¿£ÄÚµùÀ» "EUC-JP"·Î ÁöÁ¤Çϱâ À§Çؼ­ ´ÙÀ½ÀÇ META ¼±¾ðÀ» ÇÑ´Ù.

<META http-equiv="Content-Type" content="text/html; charset=EUC-JP">

META ¼±¾ð¿¡¼­ ±ÛÀÚ ¿£ÄÚµùÀº ±× ¼±¾ðÀÌ ASCII ±ÛÀÚ ÀÚüÀ» Ç¥½ÃÇÏ´Â ASCII °ª ¹ÙÀÌÆ® ÀÏ °æ¿ì¿¡ ÇÑÁ¤ÇÏ¿©(ÃÖ¼ÒÇÑ META ¿¤·¹¸àÆ® Çؼ®ÀÌ ³¡ ³¯ ¶§±îÁö) »ç¿ë ÇÒ ¼ö ÀÖ´Ù. HEAD ¿¤·¹¸àÆ®¿¡¼­ META ¼±¾ðÀº °¡±ÞÀû ÀÏÂïÇÏ¿©¾ß ÇÑ´Ù.

HTTP ÇÁ·ÎÅäÄÝÀ̳ª META ¿¤·¹¸àÆ®¿¡¼­ ¹®¼­ÀÇ ±ÛÀÚ ¿£ÄÚµù Á¤º¸¸¦ Á¦°øÇÏÁö ¸ø ÇÒ °æ¿ì¸¦ À§ÇØ, ¶ÇÇÑ HTMLÀº ¸î°¡Áö ¿¤·¹¸àÆ®¿¡¼­ charset ¾ÖÆ®¸®ºäÆ®¸¦ Á¦°øÇÑ´Ù. Á¦ÀÛÀÚ´Â ÀÌ ±â´ÉµéÀ» Á¶ÇÕÇÏ¿©, »ç¿ëÀÚ°¡ ¹®¼­¸¦ ÀÐÀ» ¶§, »ç¿ëµµ±¸°¡ ±ÛÀÚ ¿£ÄÚµùÀ» ÀÎ½Ä ÇÒ ¼ö ÀÖ´Â ±âȸ¸¦ Å©°Ô Çâ»ó ½ÃŲ´Ù.

HTML ±Ô°Ý¿¡ ºÎÇÕÇÏ´Â »ç¿ëµµ±¸´Â ¹®¼­ÀÇ ±ÛÀÚ ¿£ÄÚµùÀ» °áÁ¤ ÇÒ ¶§, ´ÙÀ½ ¿ä¾àÇÑ À§·ÎºÎÅÍÀÇ ¿ì¼± ¼øÀ§¸¦ µû¶ó¾ßÇÑ´Ù.

  1. "Content-Type"¿¡¼­ HTTP "charset" ÆĶó¸ÞÅÍ.
  2. META ¼±¾ð¿¡¼­ "Content-Type"¿¡ "http-equiv" ¼³Á¤ÀÇ "charset" °ª.
  3. ¿ÜºÎ ÀÚ¿øÀ» ÁöÁ¤ÇÏ´Â ¿¤·¹¸àÆ®ÀÇ charset ¾ÖÆ®¸®ºäÆ®.

ÀÌ ¿ì¼± ¼øÀ§ ¸ñ·Ï¿¡ Ãß°¡ÀûÀ¸·Î »ç¿ëµµ±¸´Â »ç¿ëÀÚ ¼³Á¤¸¦ »ç¿ë ÇÒ ¼ö ÀÖ´Ù. ¿¹¸¦ µé¾î, ¸¹Àº »ç¿ëµµ±¸µéÀº ÀϺ»¾î ¹®Àå¿¡¼­ »ç¿ëµÇ´Â ´Ù¾ç ÇÑ ¿£ÄÚµùÀ» ±¸º°Çϱâ À§ÇÏ¿© °èÅë ü°è(heuristics)¸¦ »ç¿ëÇÑ´Ù. ¶ÇÇÑ ¾î¶² »ç¿ëµµ±¸µéÀº ´Ù¸¥ ÁöÁ¤ÀÌ ¾øÀ» ¶§ Àû¿ëÇϵµ·Ï, »ç¿ëÀÚ°¡ Á¤ÀÇÇÏ´Â ÀÚü µðÆúÆ® ±ÛÀÚ ¿£ÄÚµùÀ» °®´Â °æ¿ìµµ ÀÖ´Ù.

»ç¿ëµµ±¸´Â Ʋ¸° "charset" Á¤º¸¸¦ »ç¿ëÀÚ°¡ µ¤¾î ¾º¿ì(override)´Â ±â´ÉÀ» Á¦°ø ÇÒ ¼ö ÀÖ´Ù. ±×·¯³ª »ç¿ëµµ±¸°¡ ±×·¯ÇÑ ±â´ÉÀ» Á¦°øÇÑ´Ù¸é, Ʋ¸° "charset" ÆĶó¸ÞÅ͸¦ °®´Â À¥ ÆäÀÌÁö¸¦ ¸¸µéÁö ¾Êµµ·Ï, ¹®¼­ ÆíÁý¿¡¼­´Â Á¦°øÇÏÁö ¸»°í, ºê¶ó¿ì¡¿¡ ¸¸ Á¦°øÇÏ¿©¾ß ÇÑ´Ù.

ÁÖ¼®: ¸¸ÀÏ Æ¯¼öÇÑ ¸ñÀûÀ» À§ÇÏ¿© [ISO10646] ÀÌ¿ÜÀÇ ±ÛÀÚ¸¦ »ç¿ë ÇÒ ÇÊ¿ä°¡ ÀÖÀ» ¶§´Â, ±× ±ÛÀÚ°¡ ÇöÀç¿Í ¹Ì·¡ÀÇ Ç¥ÁØ ¹öÀü ±ÛÀÚµé°ú Ãæµ¹ÇÏÁö ¾Êµµ·Ï, º°µµÀÇ ¿µ¿ªÀÌ ÁöÁ¤ÇÏ¿©¾ß ÇÑ´Ù. ±×·¯³ª, Åë¿ë¼º ¶§¹®¿¡, ±×·¸°Ô ÇÏÁö ¾ÊÀ» °ÍÀ» °­ÇÏ°Ô ÃßõÇÑ´Ù.

5.3 ±ÛÀÚ ÂüÁ¶

ÁÖ¾îÁø ±ÛÀÚ ¿£ÄÚµùÀ¸·Î ¹®¼­ ±ÛÀÚ ¼¼Æ®ÀÇ ¸ðµç ±ÛÀÚ¸¦ Ç¥ÇöÇÏÁö ¸ø ÇÒ ¼ö ÀÖ´Ù. ÀÌ·± ¿£ÄÚµù, ¶Ç´Â Çϵå¿þ¾î³ª ¼ÒÇÁÆ®¿þ¾îÀÇ ¼³Á¤ÀÌ »ç¿ëÀÚ°¡ ÀϺΠ¹®¼­ ±ÛÀÚ¸¦ Á÷Á¢ ÀÔ·Â ÇÒ ¼ö ¾øÀ» °æ¿ì, Á¦ÀÛÀÚ´Â SGML ±ÛÀÚ ÂüÁ¶¸¦ »ç¿ë ÇÒ ¼ö ÀÖ´Ù. ±ÛÀÚ ÂüÁ¶´Â, ±ÛÀÚ ¿£ÄÚµùÀÇ ¿µÇâÀ» ¹ÞÁö ¾Ê´Â ±â´ÉÀ¸·Î, ¹®¼­ ±ÛÀÚ ¼¼Æ®·Î ºÎÅÍ ¾î¶° ±ÛÀÚµµ ÀÔ·ÂÇÏ°Ô Çϱâ À§ÇÑ °ÍÀÌ´Ù.

HTML¿¡¼­ ±ÛÀÚ ÂüÁ¶´Â ´ÙÀ½ µÎ°¡Áö ÇüÅ·ΠÇÒ ¼ö ÀÖ´Ù.

ÄÚ¸àÆ®(comment)¾È¿¡¼­ ±ÛÀÚ ÂüÁ¶´Â Àǹ̰¡ ¾øÀ¸¸ç ´Ü¼øÇÑ Âü°í»çÇ×ÀÌ´Ù.

ÁÖ¼®: HTMLÀº Àθ®ÀÎ(inline) À̹ÌÁö·Î ±ÛÀÚ µ¥ÀÌÅ͸¦ Ç¥½ÃÇÏ´Â ´Ù¸¥ ¹æ¹ýÀ» Á¦°øÇÑ´Ù.

ÁÖ¼®: SGML¿¡¼­ ±ÛÀÚ ÂüÁ¶ Á¦ÀÏ ³¡ ";"ÀÇ ¾î¶² °æ¿ì¿¡´Â(¿¹: ÁÙ ¹Ù²Þ ȤÀº ÅÂ±× ¹Ù·Î Àü) »ý·« ÇÒ ¼ö ÀÖ´Ù. ¾î¶² ´Ù¸¥(¿¹: ´Ü¾î Áß°£) °æ¿ì¿¡´Â »ý·« µÉ ¼ö ¾ø´Ù. ÀÌ ±ÛÀÚ¸¦ ÇÊ¿ä·ÎÇÏ´Â »ç¿ëµµ±¸¿¡¼­ ¹®Á¦ ¹ß»ýÀ» ÇÇÇϱâ À§ÇØ Ç×»ó ";"¸¦ »ç¿ë ÇÒ °ÍÀ» ±ÇÇÑ´Ù.

5.3.1 ¼öÄ¡ ±ÛÀÚ ÂüÁ¶

¼ýÀÚ ÂüÁ¶´Â ¹®¼­ ±ÛÀÚ ¼¼Æ®¿¡¼­ ±ÛÀÚÀÇ ÄÚµå À§Ä¡¸¦ ³ªÅ¸³½´Ù. ¼ýÀÚ ÂüÁ¶´Â ´ÙÀ½ µÎ°¡ÁöÀÇ ÇüÅ°¡ µÉ ¼ö ÀÖ´Ù.

¸î°¡Áö ¼ýÀÚ ÂüÁ¶ÀÇ ¿¹Á¦:
¼³Á¤ µÈ ¾ð¾î³ª ºê¶ó¿ìÀú¿¡ µû¶ó 16 Áø¼ö ±ÛÀÚ ¹øÈ£, ƯÁ¤ ±ÛÀÚ ¹øÈ£¸¦ Ç¥ÇöÇÏÁö ¸øÇÏ´Â °æ¿ì°¡ ÀÖ´Ù.

ÁÖ¼®: [ISO8879]¿¡ 16Áø¼ö´Â Á¤ÀǵǾî ÀÖÁö ¾ÊÀ¸³ª [WEBSGML]ÀÇ ±â¼ú¿¡ µû¸£¸é »õ·Î¿î °³Á¤ÆÇ¿¡´Â Æ÷ÇÔ µÉ °ÍÀ¸·Î º¸ÀδÙ. ÀϹÝÀûÀ¸·Î ±ÛÀÚ Ç¥ÁØÀÌ 16Áø¼ö·Î Ç¥ÇöµÇ¹Ç·Î ÀÌ º¯È¯Àº ¸Å¿ì À¯¿ë ÇÒ °ÍÀÌ´Ù.

5.3.2 ±ÛÀÚ ¿£Æ¼Æ¼(entity) ÂüÁ¶

Á¦ÀÛÀÚ°¡ ¹®¼­ ±ÛÀÚ ¼¼Æ®¿¡¼­ ±ÛÀÚ ÂüÁ¶ÇÏ´Â ´õ Á÷°üÀûÀÎ ¹æ¹ýÀ» À§ÇÏ¿©, HTMLÀº ±ÛÀÚ ¿£Æ¼Æ¼(entity) ÂüÁ¶ ¼¼Æ®¸¦ Á¦°øÇÑ´Ù. ±ÛÀÚ ¿£Æ¼Æ¼ ÂüÁ¶´Â Á¦ÀÛÀÚ°¡ ÄÚµå À§Ä¡¸¦ ±â¾ïÇÏÁö ¾Ê°í »ó¡ÀûÀÎ À̸§À» »ç¿ëÇÏ¿´´Ù. ¿¹¸¦ µé¾î, ±ÛÀÚ ¿£Æ¼Æ¼ ÂüÁ¶ &aring;Àº ¼Ò¹®ÀÚ "å"À̸ç, ÇϳªÀÇ ¿ø(a ring;)À» "&aring;"À¸·Î Ç¥½ÃÇϹǷΠ&#229;À» ±â¾ïÇϱ⺸´Ù ½±´Ù.

HTML 4´Â ¹®¼­ ±ÛÀÚ ¼¼Æ®ÀÇ ¸ðµç ±ÛÀÚ¸¦ ±ÛÀÚ ¿£Æ¼Æ¼ ÂüÁ¶·Î Á¤ÀÇÇÏÁö´Â ¾Ê¾Ò´Ù. ¿¹¸¦ µé¾î ±ÛÀÚ ¿£Æ¼Æ¼ ÂüÁ¶¿¡¼­´Â ½Ã¸±¾î(Cyrillic) ´ë¹®ÀÚ "I"´Â Á¤ÀÇÇÏÁö ¾Ê¾Ò´Ù. HTML 4¿¡ Á¤ÀǵǾîÀÖ´Â ±ÛÀÚ ÂüÁ¶ ¸ñ·Ï ÀüºÎ¸¦ ÂüÁ¶Ç϶ó.

±ÛÀÚ ¿£Æ¼Æ¼(entity) ÂüÁ¶´Â ´ë¼Ò¹®ÀÚ ±¸º°ÇÏ¿© »ç¿ëµÈ´Ù. ±×·¡¼­ &Aring;(Å)Àº &aring;(å)°ú ´Ù¸£´Ù.

´ÙÀ½ ³×°¡Áö ±ÛÀÚ ¿£Æ¼Æ¼ ÂüÁ¶µéÀº ÀÚÁÖ »ç¿ë´Â Ư¼ö±ÛÀڷΠƯ¼öÇÏ°Ô ÁöÁ¤ÇÏ¿´´Ù.

Á¦ÀÛÀÚ°¡ ¹®Àå¿¡¼­ "<" ±ÛÀÚ¸¦ »ç¿ë ÇÒ ¶§´Â "&lt;"(ASCII 10Áø¼ö 60)À» »ç¿ëÇÏ¿©¾ß ¸¸ ½ÃÀÛű×ÀÇ ±¸ºÐÀÚ(delimiter)¿Í ±¸º° ÇÒ ¼ö ÀÖ´Ù. ¸¶Âù°¡Áö·Î Á¦ÀÛÀÚ°¡ ¹®Àå¿¡¼­ ">" ´ë½Å¿¡ "&gt;"(ASCII 10Áø¼ö 62)¸¦ »ç¿ëÇÏ¿©, µû¿ÈÇ¥ ¼ÓÀÇ ¾ÖÆ®¸®ºäÆ® °ª¿¡¼­ Á¾·áÅÂ±× ±¸ºÐÀÚ·Î À߸ø Çؼ® ÇÒ ¼ö ÀÖ´Â °ú°ÅÀÇ »ç¿ëµµ±¸¿¡¼­ ¹®Á¦¸¦ ÀÏÀ¸Å°Áö ¾Ê´Â´Ù.

Á¦ÀÛÀÚ´Â "&" ´ë½Å "&amp;"(ASCII 10Áø¼ö 38)¸¦ »ç¿ëÇÏ¿© ¿£Æ¼Æ¼ ÂüÁ¶ÀÇ ½ÃÀÛ ±¸ºÐÀÚ¿ÍÀÇ È¥µ¿À» ÇÇÇÒ ¼ö ÀÖ´Ù. ¶ÇÇÑ CDATA ¾ÖÆ®¸®ºäÆ® °ª ¼Ó¿¡¼­µµ ÀÌ ±ÛÀÚ ÂüÁ¶°¡ Çã¿ëµÇ±â ¶§¹®¿¡, ¾ÖÆ®¸®ºäÆ® °ª¿¡¼­µµ "&amp;"¸¦ »ç¿ëÇÏ¿©¾ß ÇÑ´Ù.

ÀϺΠÁ¦ÀÛÀÚ´Â µû¿ÈÇ¥(") ´ë½Å¿¡ ±ÛÀÚ ¿£Æ¼Æ¼ ÂüÁ¶ "&quot;"¸¦ »ç¿ëÇÑ´Ù. ±× ÀÌÀ¯´Â " ±ÛÀÚ°¡ ¾ÖÆ®¸®ºäÆ® °ªÀ» Ç¥Çö ÇÒ ¶§ »ç¿ëµÇ±â ¶§¹®ÀÌ´Ù.

5.4 Ç¥Çö ÇÒ ¼ö ¾ø´Â ±ÛÀÚ

»ç¿ëµµ±¸´Â ¹®¼­ÀÇ ¸ðµç ±ÛÀÚ¸¦ ÀǹÌÀÖ°Ô Ç¥ÇöÇÏ´Â °ÍÀÌ °¡´ÉÇÏÁö ¾ÊÀ» ¼ö ÀÖ´Ù. ¿¹¸¦ µé¾î, »ç¿ëµµ±¸¿¡ Àû´çÇÑ ÆùÆ®°¡ ¾ø¾î, »ç¿ëµµ±¸ÀÇ ÀÚü ±ÛÀÚ ¿£ÄÚµùÀ¸·Î Ç¥Çö µÉ ¼ö ¾ø´Â ±ÛÀÚ °ªÀÌ µÉ ¼ö Àֱ⠶§¹®ÀÌ´Ù.

ÀÌ·± °æ¿ì´Â ¾µ ¼ö ÀÖ´Â ¹æ¹ýÀÌ ¸¹±â ¶§¹®¿¡, ÀÌ ¹®¼­¿¡ ¾î¶² Áö½Ã ÁöÇ×À» Æ÷ÇÔ½ÃÅ°Áö ¾Ê¾Ò´Ù. Ç¥Çö ÇÒ ¼ö ¾ø´Â ±ÛÀÚ´Â, ±× ¿ëµµ¿¡ µû¶ó, ±× Àû¿ë ÇÁ·Î±×·¥¿¡ ÀÇÇÏÁö ¾Ê°í, ÀÚüÀÇ µð½ºÇ÷¹ÀÌ ½Ã½ºÅÛ¿¡ ÀÇÇØ Ã³¸® µÉ ¼ö ÀÖ´Ù. ƯÁ¤ ½ºÅ©¸³Æ®³ª ¾ð¾îÀÇ ÇÊ¿ä¿¡ ¸ÂÃß´Â µî ´õ °íµµÀÇ ±â´ÉÀÌ ¾ø´Ù¸é, »ç¿ëµµ±¸µéÀº ´ÙÀ½°ú °°Àº ±â´ÉÀ» °¡Áú °ÍÀ» ±ÇÇÑ´Ù.

  1. ´©¶ô µÈ ÀÚ¿ø¿¡ ´ëÇØ »ç¿ëÀÚ¿¡°Ô Àå¾Ö ¾øÀÌ ¸íÈ®ÇÏ°Ô °æ°íÇÏ´Â ±â´É äÅÃ
  2. ¸¸ÀÏ ±× µéÀÇ ¼öÄ¡Àû Ç¥Çö¿¡ ´©¶ô µÈ ±ÛÀÚ°¡ ÀÖ´Ù¸é 10Áø¼ö°¡ ¾Æ´Ñ ±ÛÀÚ ¼¼Æ® Ç¥ÁØ¿¡¼­ 16Áø¼ö¸¦ »ç¿ë

ÀÌ Trio ȨÆäÀÌÁö ¹®¼­(http://trio.co.kr/webrefer/html/charset.html)´Â ÀÚÀ¯·ÎÀÌ ¿¬°á »ç¿ëÀÌ °¡´ÉÇÔ.