<?php
// $document should contain an HTML document.
// This will remove HTML tags, javascript-x sections
// and white space. It will also convert some
// common HTML entities to their text equivalent.
$search = array ('@<script-x[^>]*?>.*?</script-x>@si', // Strip out javascript-x
'@<[\/\!]*?[^<>]*?>@si', // Strip out HTML tags
'@([\r\n])[\s]+@', // Strip out white space
'@&(quot|#34);@i', // Replace HTML entities
'@&(amp|#38);@i',
'@&(lt|#60);@i',
'@&(gt|#62);@i',
'@&(nbsp|#160);@i',
'@&(iexcl|#161);@i',
'@&(cent|#162);@i',
'@&(pound|#163);@i',
'@&(copy|#169);@i',
'@&#(\d+);@e'); // evaluate as php
$replace = array ('',
'',
'\1',
'"',
'&',
'<',
'>',
' ',
chr(161),
chr(162),
chr(163),
chr(169),
'chr(\1)');
$text = preg_replace($search, $replace, $document);
strip_tags(get_the_content($document));
?>
1 <?php
2 // $document should contain an HTML document.
3 // This will remove HTML tags, javascript-x sections
4 // and white space. It will also convert some
5 // common HTML entities to their text equivalent.
6 $search = array ("'<script-x[^>]*?>.*?</script-x>'si", // Strip out javascript-x
7 "'<[/!]*?[^<>]*?>'si", // Strip out HTML tags
8 "'([rn])[s]+'", // Strip out white space
9 "'&(quot|#34);'i", // Replace HTML entities
10 "'&(amp|#38);'i",
11 "'&(lt|#60);'i",
12 "'&(gt|#62);'i",
13 "'&(nbsp|#160);'i",
14 "'&(iexcl|#161);'i",
15 "'&(cent|#162);'i",
16 "'&(pound|#163);'i",
17 "'&(copy|#169);'i",
18 "'&#(d+);'e"); // evaluate as php
19 $replace = array ("",
20 "",
21 "\1",
22 """,
23 "&",
24 "<",
25 ">",
26 " ",
27 chr(161),
28 chr(162),
29 chr(163),
30 chr(169),
31 "chr(xxx1)"); // remove the "xxx" - this is just for showing the source
32 $text = preg_replace($search, $replace, $document);
33 ?>
'Web(웹) Study > PHP' 카테고리의 다른 글
nobody 권한이 걸려있는 폴더 삭제하기 (2) | 2008.09.02 |
---|---|
nobody 권한이 걸려있는 폴더 퍼미션 조정하기 (0) | 2008.09.02 |
한자를 한글로 변환하는 함수! (0) | 2008.07.15 |
웹페이지에서 MAC Address 구하는 ActiveX 컨트롤 (0) | 2008.02.27 |
TinyMCE, 자바스크립트 기반 내용 편집기 (2) | 2008.01.18 |