티스토리 게시물을 그누보드로 옮기기 위한 스크립트

블로그 운영팁

홈 > 자료실 > 블로그 운영팁
블로그 운영팁

  티스토리 게시물을 그누보드로 옮기기 위한 스크립트  

<?php
ini_set('display_errors', 1);
error_reporting(E_ALL);

/**
 * 스크립트 설명:
 *
 * 1) /community24/www/tistory 폴더 아래 모든 .html (소문자) 재귀 탐색
 * 2) <title>... 추출 → 맨 위 (줄바꿈 2회)
 * 3) CSS <link> 태그 전부 제거 (사용자 새 CSS 사용 예정)
 * 4) <div class="article-view"> 내부만 남김
 * 5) figcaption → alt (기존 alt 없을 때만),
 *    <figure>, <span data-lightbox>, <figcaption> 태그 모두 제거 (내용만 남김)
 * 6) 이미지 src="./img/" or "../img/" → "/tistory/{dir}/img/...", width="480"
 *    + class="myimg"
 *    + <center> ... </center> 로 감싸
 * 7) <p data-ke-size="size16"> 제거
 * 8) 최종 출력: [제목] + "\n\n" + <div class="article-view">...</div>
 */

// (A) tistory 폴더 절대경로 (서버 I/O용)
$tistoryRoot = "/community24/www/tistory";

/** 재귀 함수: tistoryRoot 아래 .html 파일(소문자) 찾기 */
function findAllHtmlFiles($dir) {
    $results = [];
    $items = glob($dir . '/*');
    if (!$items) return $results;

    foreach ($items as $path) {
        if (is_dir($path)) {
            $results = array_merge($results, findAllHtmlFiles($path));
        } else {
            $base = basename($path);
            if (strlen($base) > 5 && strtolower(substr($base, -5)) === '.html') {
                $results[] = $path;
            }
        }
    }
    return $results;
}

$htmlFiles = findAllHtmlFiles($tistoryRoot);
if (!$htmlFiles) {
    echo "<p>.html 파일을 찾을 수 없습니다. 경로나 확장자를 확인하세요.</p>";
    exit;
}
echo "<p>수정 대상 HTML 파일 수: ".count($htmlFiles)."</p>";

foreach ($htmlFiles as $filePath) {
    echo "<hr><strong>수정 중:</strong> $filePath<br>";

    $original = file_get_contents($filePath);
    if ($original === false) {
        echo "<p>파일 읽기 실패: $filePath</p>";
        continue;
    }

    // (추가) table style 변환
    // <table style="border-collapse: -> <table style="background:#009900; margin:20px 0; border-collapse:
    $original = preg_replace(
        '/<table\s+style="border-collapse:/i',
        '<table style="background:#009900; margin:20px 0; border-collapse:',
        $original
    );

    // (1) <title> 추출 & 제거
    $titleText = "";
    if (preg_match('/<title>(.*?)<\/title>/is', $original, $mTitle)) {
        $titleText = $mTitle[1];
        $original  = preg_replace('/<title>.*?<\/title>/is', '', $original);
    }

    // (2) CSS <link> 태그 모두 제거
    //    (예: <link rel="stylesheet" href="...style.css" ...>)
    //    사용자 새 CSS를 쓰기 위해 불필요한 기존 건 제거
    $original = preg_replace('/<link[^>]+rel="stylesheet"[^>]*>/i', '', $original);

    // (3) <div class="article-view"> 내부만 남김
    $articleView = "";
    if (preg_match('/<div\s+class="article-view">(.*?)<\/div>/is', $original, $mA)) {
        $articleView = '<div class="article-view">' . $mA[1] . '</div>';
    }

    // (4) figcaption → alt, <figure>, <span data-lightbox>, <figcaption> 제거
    //   (a) <span data-lightbox="..."><img ...></span>\s*<figcaption>캡션</figcaption>
    //       => <span ...><center><img alt="캡션" ...></center></span>
    $stepFig = preg_replace_callback(
        '/(<span[^>]*data-lightbox="[^"]*"[^>]*>)(.*?)<\/span>\s*<figcaption>(.*?)<\/figcaption>/is',
        function($mm) {
            $spanOpen  = $mm[1]; // <span ...
            $spanInner = $mm[2]; // typically <img...>
            $capText   = trim($mm[3]);

            // spanInner 내 <img>에 alt 없으면 alt=capText
            // 그리고 <center> ... </center>
            $converted = preg_replace_callback(
                '/<img([^>]*)>/i',
                function($m2) use ($capText) {
                    $attrs = $m2[1];
                    if (!preg_match('/\salt=/i', $attrs)) {
                        $attrs .= ' alt="'.htmlspecialchars($capText, ENT_QUOTES).'"';
                    }
                    // center 감싸
                    return '<center><img class="myimg"'.$attrs.'></center>';
                },
                $spanInner
            );
            return $spanOpen . $converted . '</span>';
        },
        $articleView
    );

    //   (b) <figure class="imageblock alignCenter"> ... </figure> => 내용만
    $stepNoFigure = preg_replace('/<figure[^>]*class="imageblock\s+alignCenter"[^>]*>(.*?)<\/figure>/is', '$1', $stepFig);

    //   (c) <span data-lightbox> 제거 => 내용만
    $stepNoSpan = preg_replace('/<span[^>]*data-lightbox="[^"]*"[^>]*>(.*?)<\/span>/is', '$1', $stepNoFigure);

    //   (d) 남은 <figcaption> 제거
    $stepNoFigcap = preg_replace('/<figcaption[^>]*>.*?<\/figcaption>/is', '', $stepNoSpan);

    //   (e) 남은 <figure> 제거
    $stepNoFig = preg_replace('/<figure[^>]*>.*?<\/figure>/is', '', $stepNoFigcap);

    // (5) 이미지 src="./img"/"../img" => /tistory/{dir}/img ...
    //     + <center><img class="myimg" width="480" ...
    //     기존 width/style 제거
    $dirName = basename(dirname($filePath));
    $stepImg = preg_replace_callback(
        '/<img([^>]*)src="(\.\.?\/)img\/([^"]+)"([^>]*)>/i',
        function($m) use ($dirName) {
            $beforeAttrs = $m[1];
            $imgFile     = $m[3];
            $afterAttrs  = $m[4];

            // width/style 제거
            $before2 = preg_replace('/\s*(width|style)="[^"]*"/i', '', $beforeAttrs);
            $after2  = preg_replace('/\s*(width|style)="[^"]*"/i', '', $afterAttrs);

            $newSrc = 'src="/tistory/'.$dirName.'/img/'.$imgFile.'"';

            // class="myimg" width="480"
            return '<br><img '.$before2.' '.$newSrc.' width="480"'.$after2.'><br><br>';
        },
        $stepNoFig
    );

    // (6) <p data-ke-size="size16"> 제거
    $stepP = preg_replace('/<p[^>]*data-ke-size="[^"]*"[^>]*>/i', '<p>', $stepImg);

    // (7) article-view 다시 추출
    $finalArticle = "";
    if (preg_match('/<div\s+class="article-view">(.*?)<\/div>/is', $stepP, $m2)) {
        $finalArticle = '<div class="article-view">'.$m2[1].'</div>';
    }

    // 최종 = [제목] + 2줄공백 + [finalArticle]
    $final = $titleText . "\n\n" . $finalArticle;

    // 저장
    $r = file_put_contents($filePath, $final);
    if ($r === false) {
        echo "<p>파일 쓰기 실패: $filePath</p>";
    } else {
        echo "<p>수정 완료: $filePath</p>";
    }
}

echo "<hr><p>처리 완료!</p>";
?>
 
1 Comments
블로그학교 03.31 17:50  
tistory 디렉토리를 root에 만들고,
해당 스크립트를 tistory.php로 저장해서 tistory 디렉토리 안에 업로드 합니다.
그리고, 티스토리에서 백업받은 파일(번호 형태의 폴더가 게시물의 갯수만큼 있음)을 모두 tistory 디렉토리에 함께 업로드 합니다.
주소창에
https://your_domain.com/tistory/tistory.php 를 실행하면
불필요한 스크립트를 걷어내고, 제목과 본문만 남겨줍니다.
참고로 style.css는 작업의 편의상 버립니다.
이제 tistory 디렉토리에 있는 html 파일을 열어보면 제목+본문내용(html)로 변환되어 있으니 편의에 따라 자유롭게 사용하시면 됩니다.
Facebook Twitter GooglePlus KakaoTalk NaverBand