티스토리 게시물을 그누보드로 옮기기 위한 스크립트
<?php
ini_set('display_errors', 1);
error_reporting(E_ALL);
/**
* 스크립트 설명:
*
* 1) /community24/www/tistory 폴더 아래 모든 .html (소문자) 재귀 탐색
* 2) <title>... 추출 → 맨 위 (줄바꿈 2회)
* 3) CSS <link> 태그 전부 제거 (사용자 새 CSS 사용 예정)
* 4) <div class="article-view"> 내부만 남김
* 5) figcaption → alt (기존 alt 없을 때만),
* <figure>, <span data-lightbox>, <figcaption> 태그 모두 제거 (내용만 남김)
* 6) 이미지 src="./img/" or "../img/" → "/tistory/{dir}/img/...", width="480"
* + class="myimg"
* + <center> ... </center> 로 감싸
* 7) <p data-ke-size="size16"> 제거
* 8) 최종 출력: [제목] + "\n\n" + <div class="article-view">...</div>
*/
// (A) tistory 폴더 절대경로 (서버 I/O용)
$tistoryRoot = "/community24/www/tistory";
/** 재귀 함수: tistoryRoot 아래 .html 파일(소문자) 찾기 */
function findAllHtmlFiles($dir) {
$results = [];
$items = glob($dir . '/*');
if (!$items) return $results;
foreach ($items as $path) {
if (is_dir($path)) {
$results = array_merge($results, findAllHtmlFiles($path));
} else {
$base = basename($path);
if (strlen($base) > 5 && strtolower(substr($base, -5)) === '.html') {
$results[] = $path;
}
}
}
return $results;
}
$htmlFiles = findAllHtmlFiles($tistoryRoot);
if (!$htmlFiles) {
echo "<p>.html 파일을 찾을 수 없습니다. 경로나 확장자를 확인하세요.</p>";
exit;
}
echo "<p>수정 대상 HTML 파일 수: ".count($htmlFiles)."</p>";
foreach ($htmlFiles as $filePath) {
echo "<hr><strong>수정 중:</strong> $filePath<br>";
$original = file_get_contents($filePath);
if ($original === false) {
echo "<p>파일 읽기 실패: $filePath</p>";
continue;
}
// (추가) table style 변환
// <table style="border-collapse: -> <table style="background:#009900; margin:20px 0; border-collapse:
$original = preg_replace(
'/<table\s+style="border-collapse:/i',
'<table style="background:#009900; margin:20px 0; border-collapse:',
$original
);
// (1) <title> 추출 & 제거
$titleText = "";
if (preg_match('/<title>(.*?)<\/title>/is', $original, $mTitle)) {
$titleText = $mTitle[1];
$original = preg_replace('/<title>.*?<\/title>/is', '', $original);
}
// (2) CSS <link> 태그 모두 제거
// (예: <link rel="stylesheet" href="...style.css" ...>)
// 사용자 새 CSS를 쓰기 위해 불필요한 기존 건 제거
$original = preg_replace('/<link[^>]+rel="stylesheet"[^>]*>/i', '', $original);
// (3) <div class="article-view"> 내부만 남김
$articleView = "";
if (preg_match('/<div\s+class="article-view">(.*?)<\/div>/is', $original, $mA)) {
$articleView = '<div class="article-view">' . $mA[1] . '</div>';
}
// (4) figcaption → alt, <figure>, <span data-lightbox>, <figcaption> 제거
// (a) <span data-lightbox="..."><img ...></span>\s*<figcaption>캡션</figcaption>
// => <span ...><center><img alt="캡션" ...></center></span>
$stepFig = preg_replace_callback(
'/(<span[^>]*data-lightbox="[^"]*"[^>]*>)(.*?)<\/span>\s*<figcaption>(.*?)<\/figcaption>/is',
function($mm) {
$spanOpen = $mm[1]; // <span ...
$spanInner = $mm[2]; // typically <img...>
$capText = trim($mm[3]);
// spanInner 내 <img>에 alt 없으면 alt=capText
// 그리고 <center> ... </center>
$converted = preg_replace_callback(
'/<img([^>]*)>/i',
function($m2) use ($capText) {
$attrs = $m2[1];
if (!preg_match('/\salt=/i', $attrs)) {
$attrs .= ' alt="'.htmlspecialchars($capText, ENT_QUOTES).'"';
}
// center 감싸
return '<center><img class="myimg"'.$attrs.'></center>';
},
$spanInner
);
return $spanOpen . $converted . '</span>';
},
$articleView
);
// (b) <figure class="imageblock alignCenter"> ... </figure> => 내용만
$stepNoFigure = preg_replace('/<figure[^>]*class="imageblock\s+alignCenter"[^>]*>(.*?)<\/figure>/is', '$1', $stepFig);
// (c) <span data-lightbox> 제거 => 내용만
$stepNoSpan = preg_replace('/<span[^>]*data-lightbox="[^"]*"[^>]*>(.*?)<\/span>/is', '$1', $stepNoFigure);
// (d) 남은 <figcaption> 제거
$stepNoFigcap = preg_replace('/<figcaption[^>]*>.*?<\/figcaption>/is', '', $stepNoSpan);
// (e) 남은 <figure> 제거
$stepNoFig = preg_replace('/<figure[^>]*>.*?<\/figure>/is', '', $stepNoFigcap);
// (5) 이미지 src="./img"/"../img" => /tistory/{dir}/img ...
// + <center><img class="myimg" width="480" ...
// 기존 width/style 제거
$dirName = basename(dirname($filePath));
$stepImg = preg_replace_callback(
'/<img([^>]*)src="(\.\.?\/)img\/([^"]+)"([^>]*)>/i',
function($m) use ($dirName) {
$beforeAttrs = $m[1];
$imgFile = $m[3];
$afterAttrs = $m[4];
// width/style 제거
$before2 = preg_replace('/\s*(width|style)="[^"]*"/i', '', $beforeAttrs);
$after2 = preg_replace('/\s*(width|style)="[^"]*"/i', '', $afterAttrs);
$newSrc = 'src="/tistory/'.$dirName.'/img/'.$imgFile.'"';
// class="myimg" width="480"
return '<br><img '.$before2.' '.$newSrc.' width="480"'.$after2.'><br><br>';
},
$stepNoFig
);
// (6) <p data-ke-size="size16"> 제거
$stepP = preg_replace('/<p[^>]*data-ke-size="[^"]*"[^>]*>/i', '<p>', $stepImg);
// (7) article-view 다시 추출
$finalArticle = "";
if (preg_match('/<div\s+class="article-view">(.*?)<\/div>/is', $stepP, $m2)) {
$finalArticle = '<div class="article-view">'.$m2[1].'</div>';
}
// 최종 = [제목] + 2줄공백 + [finalArticle]
$final = $titleText . "\n\n" . $finalArticle;
// 저장
$r = file_put_contents($filePath, $final);
if ($r === false) {
echo "<p>파일 쓰기 실패: $filePath</p>";
} else {
echo "<p>수정 완료: $filePath</p>";
}
}
echo "<hr><p>처리 완료!</p>";
?>