タグ

圧縮に関するotori334のブックマーク (72)

  • データモッシュとは [単語記事] - ニコニコ大百科

    データモッシュ単語 データモッシュ 2.2千文字の記事 7 0pt ほめる 掲示板へ 記事編集 原理方法歴史ニコニコ動画におけるデータモッシュ関連項目外部リンク掲示板データモッシュ(datamosh)とは、動画ファイルの情報を意図的に破壊することによって、映像にある種の美的効果を与える、グリッチアートの手法の一つである。 原理 データモッシュは、動画圧縮のために用いられている「フレーム間予測符号化」と呼ばれる技術の特性を利用した手法である。 一般に動画においては、現在のフレームはその直前のフレームと共通する部分を多く持っている。それゆえ、すべてのフレームが完全な情報を含んでいる必要はなく、最初に完全な情報を含んだフレームがあれば、そのあとには、前のフレームと比較して変化があった部分の差分情報だけを含んだフレームさえあれば、描画が可能となる。差分情報だけを含んだフレームは、完全な情報を含むフ

    データモッシュとは [単語記事] - ニコニコ大百科
  • Lyra V2 - a better, faster, and more versatile speech codec

    The latest news from Google on open source releases, major projects, events, and student outreach programs. Since we open sourced the first version of Lyra on GitHub last year, we are delighted to see a vibrant community growing around it, with thousands of stars, hundreds of forks, and many comments and pull requests. There are people who fixed and formatted our code, built continuous integration

    Lyra V2 - a better, faster, and more versatile speech codec
  • 片岡龍峰 on Twitter: "惑星間空間衝撃波が地球に到来しました。いま地磁気が急激に圧縮されています。 https://t.co/xZUvkeRH9U"

  • Film Grain Synthesis in AV1

    Film grain synthesis in AV1 Published Nov. 3, 2019, updated Dec. 18, 2019. This page describes the film grain synthesis as defined in the AV1 film grain tool. Recently, there have been a lot of question on the film grain in AV1. Hopefully, this page can answer some of them. If you would like to get more information, you can follow links on this page or contact me directly. Motivation to preserve f

    Film Grain Synthesis in AV1
  • 朝日新聞社の長文要約生成APIを使ってブログの要約を自動生成する仕組みを構築した - Lambdaカクテル

    先日朝日新聞社によって長文要約APIがリリースされました。要約をAPIで取得できるという点が面白いと感じたので、このブログ(blog.3qe.us)の記事を閲覧したときに自動的に要約を見られるような仕組みを作ってみようと思い、1週間ちょっとかかってしまいましたが動くものができたので紹介します。 www.itmedia.co.jp 記事冒頭に要約コーナーを出現させる この仕組みによって、記事の冒頭に要約コーナーが勝手に出現して要約を表示します。 こんな感じで要約が表示されます いくつかの記事では既に生成ができていますが、API自体は1日に20回までの制限があるので、全ての記事にはまだ行き渡っていません。 まだ要約が生成されていない記事にはpreparing abstractという文言が表示されます。 キューに入った状態 句読点の問題かちょっと要約が怪しいところもありますが、おおむね正しい要約

    朝日新聞社の長文要約生成APIを使ってブログの要約を自動生成する仕組みを構築した - Lambdaカクテル
  • 患者長ひっく on Twitter: "電 12ピクセル丸ゴシックへの圧縮トリック https://t.co/fE1K2haP0p"

    電 12ピクセル丸ゴシックへの圧縮トリック https://t.co/fE1K2haP0p

    患者長ひっく on Twitter: "電 12ピクセル丸ゴシックへの圧縮トリック https://t.co/fE1K2haP0p"
  • 大容量ファイルのSCP転送を高速にする方法 - 元RX-7乗りの適当な日々

    比較的大きいサイズのファイルをSCPで転送することがあって、できるだけ高速化してみたかったので、色々試してみたメモ。 scpというかsshには、暗号化方式と圧縮有無の指定があるので、それらのベンチマークを。 尚、以下は、SSH v2が対象です。v1はかなり遅かったのと、そもそも使っていないので試していません。 (追記: 2019/11) エントリの情報は既に古いため、以下のエントリにて再検証しています。あわせてご覧くださいませ。 ベンチマークで利用した環境 [Server1] <=> [Gigabit Switching Hub] <=> [Server2] Server1 (HP ML115 G5) AMD Phenom 9950, 8GB, RAMディスク使用, Gigabit Ethernet Server2 (HP ML115 G1) AMD Opteron 1210, 4GB,

    大容量ファイルのSCP転送を高速にする方法 - 元RX-7乗りの適当な日々
  • rsync - Wikipedia

    rsync(アールシンク) は、UNIXシステムにおいて、差分符号化を使ってデータ転送量を最小化し、遠隔地間のファイルやディレクトリの同期を行うアプリケーションソフトウェアである。類似のプログラムやプロトコルにはない rsync 独自の特徴として、ミラーサイトとの転送が双方向に高々1回で済む点がある。rsync はディレクトリ内容を表示し、ディレクトリやファイルをコピーできる。オプションでデータ圧縮や再帰も指定可能。 rsync プロトコルのデーモン rsyncd がデフォルトで使うTCPポート番号は 873 である。rsync はローカルなディレクトリ間の同期にも使えるし、RSHやSSHなどのリモートシェル経由でも使える。後者の場合、rsync のクライアントプログラムはローカルとリモートの両方にインストールされている必要がある。 GNU General Public License で

  • Opusでエンコードする:tech.ckme.co.jp

    コーデックには -acodec libopus を指定する。 ビットレートを指定する 可変ビットレート、固定ビットレートとも、ビットレートを指定するには-b:aで指定する。 -b:a 128k この場合、128kbpsに指定している。 許容範囲内といえる最小ビットレートは80kbps、推奨ビットレートは128kbps以上である。 固定ビットレートと可変ビットレートモード Opusでは、デフォルトは可変ビットレートである。固定ビットレートにするには -vbr off とする。 -vbr on とすると可変ビットレートになるが、デフォルトでこのようになっているのでわざわざ指定する必要はない。 会話向けに最適化する -application voip オプションをつけると、会話向けに最適化される。 デフォルトでは -application audio 音楽向けとなっている。 このほかに -app

  • MP3より高音質! YouTube/Discord採用の「Opus」コーデックを試した【藤本健のDigital Audio Laboratory】

    MP3より高音質! YouTube/Discord採用の「Opus」コーデックを試した【藤本健のDigital Audio Laboratory】
  • 結局ハードウェアエンコードってどうなの?(H265篇) - Qiita

    さくらインターネット Advent Calendar 2021 2日目の記事です。 前置き どうも、さくらインターネットクラウド事業部のやまけんです。 2018年のアドベントカレンダーにNVIDIAのGPUに搭載されているNVEncを使う話を書きましたがその続きになります。 おかげさまで上記記事については一定数のニーズがあるようで、CUDAのバージョンが上がったりNVIDIA VIDEO CODECのバージョンが上がったり、UbuntuのLTS版のバージョンが上がったりするたびにメンテナンスをしておりまして、未だ参考にしていただいてることに感謝いたします。 はてさて、この記事執筆から3年経ちまして、ハードウェアエンコードってどうなのっていうところで、比較検証などを記事にしたいと思います。 検証環境 Fujitsu TX1310M3 CPU Celeron G3930 Mem 16GB G

    結局ハードウェアエンコードってどうなの?(H265篇) - Qiita
    otori334
    otori334 2022/02/25
    “今回NVEncが散々な値になっているのは、一つにTU117がH265のBフレーム圧縮に対応していないため、容量が大きくなりやすいという傾向があると考えられる”
  • ffmpegでNVENCを使ってエンコードしてみる

    NVIDIAのGPUのビデオエンコーダNVENCを使ってエンコードをしてみます。CPUを使ったエンコーダに比べ大変高速です。 Windowsを前提に記事を書きますが、ffmpegのオプションの説明になるのでMacLinuxでも使えます。 NVENCは直に動かすことができません。ビデオ編集ソフトやビデオエンコードソフトにNVENCが組み込まれているものを使います。 ここではffmpegを使って動かします。 ffmpegはコマンドプロンプトで動かします。Window画面はありませんので取っつき難いと思っている方がほとんどでしょう。エンコードには設定するパラメータがたくさんありWindows画面にすべて表示していられません。また、エンコードでは一度設定を決めてしまうと設定を毎回変える必要は無いのでWindow画面とか必要なくなってしまうのです。コマンドプロンプトで動かすのが一番スッキリした方法

    ffmpegでNVENCを使ってエンコードしてみる
  • ffmpegでNVENC + H265 爆速エンコ! | ピンボケ日記2 SONY α6700 & パソコン & ビデオ

    GTX1660ti を導入したのでH265, NVENCの HEVC で Bフレームが使えるとのことだったので色々テスト。 GTX1060の載った Xeon E5 2667 V2 8コアPCではNVENCを使ってBフレーム出力ができないのでソフトエンコの libx265 で作業。

    ffmpegでNVENC + H265 爆速エンコ! | ピンボケ日記2 SONY α6700 & パソコン & ビデオ
  • NVEncで超高速エンコードにFFmpegで再挑戦!今度はうまくいった!

    動画を高速に変換しよう! NVIDIAのGPUを利用したハードウェアエンコード機能「NVEnc」。CUDAによるエンコードの後継となるもので、CPUに負荷をかけることなく高速にエンコードができます。(光の速さは言い過ぎですけどね) 前回は結局うまくいきませんでしたが、今回再挑戦してうまくいきましたよ! 前回失敗した原因 明確な原因が分かっているわけではありませんが、使っているグラフィックボードのドライバーを更新したらうまく実行できるようになりました。 私が使っているグラフィックボードはNVIDIAのGTX960を搭載しています。現在使っているGPUのドライバーは376.53。2017年3月29日現在の最新バージョンは378.92ですが、そちらはまだ試していません。 GPUドライバーの更新だけでうまく実行できるようになりましたが、ついでにFFmpegの方も新しくしています。現在使っているバー

    NVEncで超高速エンコードにFFmpegで再挑戦!今度はうまくいった!
  • Ubuntu 18.04 on WSL2によってNVENC(CUDA)を使おうとしてみた結果 - Qiita

    結論から言うと(まだ)出来ませんでした。 ここでは、今回やろうとしたこと(動画のエンコード)とその結果を残します。 なお、私の環境は以下の通りです(今年に入って新しくしました)。 Windows10 Pro Insider Preview Build 21292 Intel Core i7-10750H 2.60GHz NVIDIA GeForece RTX 2060 with Max-Q また、WSL2上のLinux DistroはUbuntu 18.04 LTSです。 概要 最近公私ともに動画データが溜まってきており、容量の大きさから保存に難儀していたので一括して圧縮しようと思ったことがきっかけです。 私はWSL2上のUbuntu 18.04で学習することが多いので、この上でこの課題を解決することを考えました。Ubuntuで簡易な動画編集といえばffmpegがあるので、これを使います。

    Ubuntu 18.04 on WSL2によってNVENC(CUDA)を使おうとしてみた結果 - Qiita
  • オーディオコーデック - Wikipedia

    オーディオコーデック とは音声データをエンコードまたはデコードするコーデック。また、デジタルデータストリームをエンコードまたはデコードできるデバイスまたはコンピュータープログラムを指す[1][2][3][4]。 ソフトウェアでは、オーディオコーデックは特定のオーディオファイルまたはストリーミングメディアオーディオコーディング形式に従ってデジタルオーディオデータを圧縮および圧縮解除するアルゴリズムを実装するコンピュータープログラムを指す。アルゴリズムの目的は、品質を維持しながら、最小限のビット数で高忠実度のオーディオ信号を表現することである。これにより、保存されたオーディオファイルの送信に必要なストレージスペースと帯域幅を効果的に削減できる。 ほとんどのソフトウェアコーデックは、1つまたは複数のマルチメディアプレーヤーに接続するライブラリとして実装される。最新のオーディオ圧縮アルゴリズムのほ

  • 見て作って学ぶ、PDFファイルの基本構造|TechRacho by BPS株式会社

    こんにちは。見習いエンジニアのwestです。 PDFファイルって、皆さん使いますか? 仕様書、説明書、論文、電子書籍など… おそらく避けては通れないファイルフォーマットだと思います。 そんな身近なPDFですが、内部の構造はどのようになっているのか?そもそも中身って見られるのか? 案外知らないものです。私も知りませんでした。 今回はそんなPDFの構造を、実践を交えて簡単にご紹介します。 PDFの基的な構造を知っておくと、物知りになれますし、PDFを処理するソフトを作るときなどに役立つはずです。 踏み込むとかなりディープになってしまうので、あくまで基構造の理解に必要な内容のみピックアップします。 目次 PDFファイルの基的な構造 PDFファイルを構成する4セクション PDFファイルの体 = オブジェクトのグラフ PDFファイルの中身をテキストエディタ+フリーソフトで見てみる PDFファ

    見て作って学ぶ、PDFファイルの基本構造|TechRacho by BPS株式会社
  • チップチューン - Wikipedia

    ゲームボーイを使用したチップチューンを演奏する際の機材構成 チップチューン (英: Chiptune) は、コンピュータ音楽の黎明期において厳しい制約のある音源チップのみで作られた音楽のスタイルを志向した音楽ジャンルである。 概要[編集] おもに1980年代に発売されたパーソナルコンピューターや家庭用ゲーム機に搭載されていた内蔵音源チップを直接使用したり、それらをエミュレートした環境で作られる場合が多い。また、他の音源で「チップチューン風」の音楽が作られたり、他の楽器音と同時演奏されることもある。これらが広い意味でのチップチューンと見なされる場合もあるが、実機特有の雑音(ヒスノイズ・ハムノイズ・クリップノイズなど)や位相のずれを「実機らしさ」として評価される場合がある為「実機演奏された物だけがチップチューンである」という見方もある。 チップチューンに使われる音源には、「同時発声数が少ない」

    チップチューン - Wikipedia
  • 差分パルス符号変調 - Wikipedia

    差分パルス符号変調(さぶんパルスふごうへんちょう、英: differential pulse-code modulation、DPCM)あるいは差分PCM(英: differential PCM)とは信号間の差分を PCM で符号化する方式である。単純な処理で情報の圧縮ができるため、差分PCMの応用である ADPCM と共に音声符号化や画像符号化の分野で古くから使われている。 概要[編集] 音声や画像などの隣り合ったサンプル間には相関があるため、隣り合ったサンプル値を予測値として使用することができる。サンプル値自身の値と比較すると予測値と実際の値の差は通常小さくなるため、差分のみを符号化すれば少ないビット数で表現でき情報の圧縮を行うことができる。 差分PCM はベル研究所のカトラー(Cassius C. Cutler)が発明し、1950年に特許を出願した[1]。 詳細[編集] 差分PCM

  • マルコフ情報源