Posts tagged ‘Kopia backup software’

気が向いたので、ちょっとKopia(クラウドストレージ対応のバックアッププログラム)を いじってみた。(「いじった」程度なので今後変わる可能性はあるが、)結構気に入った。今使っているduplicacyより ずっと使いやすい印象だ。

まず、ドキュメントが しっかりしていて分かりやすいし、GUIは気軽・手軽に使えるし(ちょっと試すのに充分良い)、CLIはduplicacyと違って「すっ」と(自然・普通に)使える。もちろん、その出力も分かりやすい。

duplicacyは ほとんど真逆で、ドキュメントは貧弱かつ分散している(いつも探す羽目になる)、(GUIは有料なので使ったことがない、)CLIは何度使っても分かりにくく、引数の指定も すぐには分からず、間違いやすいから神経を遣うし、出力だって分かりやすいとは言えない。。。

なお、現在のKopiaのGUIは(僕を含む多く?の人が大嫌いな)Electronベースだが、Goで作る計画もあるようだ。ただ、今でも、web版(サーバーモードで動かす)なら(大食らいの)Electronを使わずに済む。

事前に調べて気になって居た、ストレージの認証情報(キー、パスワード)が設定ファイルに平文で書き込まれるためにセキュリティ上の不安がある件は、それらを環境変数からも取れそうなので 何とかなりそうだ。

バックアップ対象(基本的に除外)の設定はgit(gitignore)と同様とのことで、(duplicacyより)機能は少ないものの、設定(想定)どおりに動く印象だ。設定ルールはサイトには詳しく書いてないが、gitignoreのドキュメントを見れば分かりそうだ。そもそも、gitignoreは いつも使っているからとっつきやすく、単純明快なのがいい。

duplicacyはバックアップ対象指定の機能は多い(対象/除外それぞれにワイルドカード/正規表現での指定が可能)ものの、そのせいで設定がグチャグチャになり、そのうえ謎が多くて、どう設定すれば思ったように動くのか分からず(対象と除外の順序関係が難しい)、いつも試行錯誤している。

そんなことになるのなら、Kopiaのように既存のものを使って、作る手間も使う手間も省くほうがずっと賢い。

バックアップ対象設定の動作確認も、duplicacyより ずっと やりやすい。duplicacyはdry-run+デバッグモード(上記のように設定が謎なので、「どうしてそうなった?」を出す必要がある)で起動して、長くて見にくい出力をチェックしなくてはいけないが、Kopia(コマンド: kopia snapshot estimate --show-files)は出力が簡潔なので、見ればすぐに分かる。もちろん、バックアップ対象のファイルが多い場合は出力も長くなるが、duplicacyよりは ずっと分かりやすそうだ。

という訳で、試す価値は充分ありそうなので、更にいろいろやってみたい。

なお、Kopiaは まだV0.11なので、正式に使うのには適さないと思うが(とは言え、ちゃんと使っているユーザーは多そうだ)、まあ、その分ゆっくり試せるとも言える。

 

PS. Kopiaはduplicacyより ずっと使いやすいものの、どちらも使ったことがない場合は、最初に これらの動作(バックアップ方法)の概念や概要や用語を理解する必要がある。これらは普通のファイル単位のバックアッププログラムと違う(対象をブロック化し、重複排除し、変更履歴を保存して格納する)ので、そこがハードルになるかも知れない。が、一旦分かれば、どちらも基本的には同様である。

PS2. わがままなので、まだちゃんと使ってもいないのに、「実はKopiaよりもっと いいものがあるのではないか?」などと思ったりもするが、まあ、それも おいおい調べてみたい。とは言え、最高のものでなくても、duplicacyより使いやすければ それで充分という気は大いにする。

 

(2023/5/8 14:30 誤記を修正)

  • Kopia

    Kopia

    Fast and Secure Open-Source Backup Software for Wi…

  •  0
  •  0
Keys: , , ,

デスクトップPCのクラウドストレージへのバックアップに、Backblaze B2 (以下、B2)に加えてGoogle Cloud Stroage Archive (以下、GCSA)も使うのを開始してから約半年経った。

B2は変更頻度の高い「新しいデータ」のバックアップに、GCSAは基本的に変更しない「古いデータ」や大容量データ(音楽など)のバックアップ(アーカイブ)と、階層的に使っている。

特に問題はない。

だけでは 余りにも ざっくりし過ぎだが、本当にそうなのだ。あえて書くとすれば、一つだけ心配なこととして、GCSAに保存しているデータを いざ使おうとしたら「駄目」になっていた※とかいうことがないかである。が、こればかりはどうしようもない。抜き出してチェックするにしても、頻繁にするとアクセスの料金(結構高く付く)が かさむためだ。まあ、Googleとバックアップに使っているソフト(duplicacy)を信じるしかない。

※GCSA: 「すまん、いつの間にかストレージが おかしくなってたわ」的な・・・

ちなみに、今まで4年くらいB2でduplicacyを使っており、(ヘマして消してしまったファイル)少量を数回リストアしたことがあるが、問題が起こったことはない。もちろん、バックアップでもduplicacyに起因する大きな問題は起こっていない。

以下、データ量・料金や気付いたこと・事前の想定と違ったことなどを書く。GCSAと一緒に使っているB2についても書く。なお、B2にはデスクトップ以外にサーバのデータもバックアップしているが、別ものなのとデータ量が小さいので以下には含めていない。

現在のデータ量と料金

  • GCSA: 約946GB, 約150円/月 (税込み) → 年額見込み: 約1800円 (税込み)
    • 月によって追加バックアップをしたりするため、微妙に異なる。あと、為替相場でも変わる。
  • B2: 約80GB, 約52円/月 → 年額見込み: 約630円 (現在のデータ量からの予想。USDで支払いのため消費税抜き(どういう扱いかは不明)。1USD= 130円とした。)
    • 正味のデータ量は約30GBなので、約20円/月 → 年額見込み: 約240円になるはず。
  • 合計: 約1TB, 約202円/月 → 年額見込み: 約2430円

他のPC用バックアップサービスはデータ量無制限が多いので比較が難しいが、僕としては充分に安いと感じる。B2とGCSAを合わせた単価は約USD 0.0015(0.2円)/GB・月相当で、普通のストレージに比べれば随分安い(ただ、それらと同様に気軽にアクセスできる訳ではない)。

気付いたこと・事前の想定と違ったことなど

  • GCSA
    • 日本法人を経由するためか、消費税が掛かるのを意識せずにいて、最終的に請求される料金が当初の想定より1割増えて、思わぬ落とし穴だった。
      • だったら、料金を円建てにして少しは為替変動を吸収して欲しいものだ。まあ、国からの指導(「(消費税含む)税金納めろ!」)※で やってるだけなのかも知れないが。
        • ※そういえば、AWSも日本法人からの請求になったようだ。
        • そうは言っても、(消費税の根拠・規則は知らないが、)海外にあるクラウドを日本で使うのは、国内で「消費」していると言えるのか疑問だ。どこが提供しているにしろ、何らかの役務を国内で利用しているから そうなのか。
        • だけど、海外の店から通販で買って輸入する場合には消費税が掛からないのとは矛盾する気がする。
        • まあ、専門家に聞くしかない。
    • 消費税だけでなく、近頃急に円安になったため、始めた時から結構(約1割)値上がりした。
      • 今のところ、日々の料金の増加は月の2/3くらいが5円、1/3くらいが4円になっている。
    • 当初は気付いていなかった使い方が分かって来た。
      • 料金を大きく増やさずに小まめに少量(例: 1GB以下)の追加バックアップすることが可能。
        • バックアップ前にしている整合性チェックを省けば良い。
          • 大体、1円/回+データ量比例分程度になる。(チェックありだと5円/回+データ量比例分)
          • 整合性チェックは、大量のバックアップをする時などにする。
        • → 今は、必要なら週末に追加バックアップをしている。意図せずに古いデータ領域に追加してしまうことが結構あるため。
          • それをうまく誤魔化す(別の場所に置いて何とかする)作業よりは、普通に一緒に置いてバックアップするほうが楽なので。
  • B2
    • 正味の(事前に期待していた)データ量まで減るか、まだ不明。
      • 履歴(約6か月分)が保存されることもあり、正味のデータ量は30GBなのに対し、今月のprune(履歴削除)処理の前は その5.7倍(170GB)だったのが、prune処理によって2.7倍(80GB)にまで減った。
        • なお、GCSを使い始める時点では約450GB(うろ覚え)だった。
      • かなり減って料金は充分安くなったが、まだ「本物」ではない(正味のデータ量より随分多い)。
        • この増分は、履歴によるのかオーバヘッド(ファイルを削除したため、余計な部分が残って居る)なのか、まだ分かっていない。
      • 今後もprune処理で減るかも知れないので、もう少し様子を見ることにした。
      • もし減らなかったら、新しくバックアップし直すか、そのままか、安い方にする。

 

PS. 本文とは直接関係ないが、バックアップに使っているソフトduplicacyの問題らしきものが一つだけある。: デスクトップでなく、サーバ(VPS)だけで起こることだが、たまにduplicacyのprune(古い履歴の削除)処理が失敗することがある(「(pruneで削除しようとしている)チャンクがない」というエラーが起こる)。数か月に一回くらい起こる。

なかなか原因が分からなかったが、どうやら、clamscanの実行中にduplicacyでpruneかバックアップをすると起こるようだ(バックアップの場合は、そのチャンクがpruneされる時に起こるようだ)。試しに、clamscanの実行中はduplicacyの起動を延期し、逆にduplicacyの実行中はclamscanの起動を延期するようにしたら、起こらなくなった。

ただ、まだそれほど長く確認していないので、関係ない可能性はある。

clamscanの実行中は負荷が高く空きメモリが少ないので、duplicacyの処理やB2のサーバへの通信が異常になってしまうのかと想像しているが、確証はない。また、この問題はデスクトップでは起こらないので、サーバのVPSとの相性のようなものかも知れない。VPSはメモリ量が少ないのでその関係だろうか?

そういえば、プロバイダの保守でVPSのプラットフォーム(ハード+ホスティングソフト?)が更新されてから起こるようになった覚えがあるので、VPSとの関係がありそうだ。どこに聞いたらいいか分からず、難しい。

PS2. 同じくGCSとは関係ない話。: duplicacyに問題はないが、いくつか不満はある。例えば、資料が今一つ(基本的なものはあるけど不充分で、残りはフォーラム(作者(と それらしき人)がtipsとして書いているものが多い)を探して見るしかない)、使い勝手が今一つ(なんか ごちゃごちゃしている → 資料が不充分になる、やりたいことができるか・どうしたらできるか不明、できそうなことができない、バックアップ対象選択フィルタの機能が貧弱)とか、動作・中身が複雑で把握しにくい(→ トラブル時に調査・復旧しにくい)ことだ。

更に、調べていて偶然見付けた、未解決の問題が放置されているのも気になった。おそらくユーザーの使用環境に起因するのだろうが、放置する姿勢が良くない。

これ以外にも、ごく真っ当な修正要望(エラー時にも0を返すのは良くない)にも対応していない。 → 良く居る頑固な開発者のようだ。

そして、先日、別の稿に書いた認証情報の格納方法の件で他にいいもの(例: rcloneのように設定ファイルを暗号化できるもの)がないか探してみたら、duplicacyと同様なカテゴリのものでKopiaというのが見つかった。まだv0.10.7だけど、雰囲気や資料は良さそうなので、しばらく様子を見たい。ただ、これはストレージの認証情報をファイルに平文で書くので、そこが ちゃんとされない限り使えない。

それでも、試してはいないものの、Kopiaには(duplicacyと同様に)CLIとGUIがあるが、duplicacyと違ってGUIも(今は?)無料なので、手軽に使いたい方には いいかも知れない。あと、duplicacyと違って、バックアップストレージをマウントして中身に手軽にアクセスできるのは すごく便利そうだ。

 

(5/23 5:33 少し加筆・修正。PSを追加; 7時 PS2を追加)

  •  0
  •  0
Keys: , , , , , , ,