calibre-web/cps/comic.py

# -*- coding: utf-8 -*-

#   This file is part of the Calibre-Web (https://github.com/janeczku/calibre-web)
#     Copyright (C) 2018-2022 OzzieIsaacs
#
#   This program is free software: you can redistribute it and/or modify
#   it under the terms of the GNU General Public License as published by
#   the Free Software Foundation, either version 3 of the License, or
#   (at your option) any later version.
#
#   This program is distributed in the hope that it will be useful,
#   but WITHOUT ANY WARRANTY; without even the implied warranty of
#   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
#   GNU General Public License for more details.
#
#   You should have received a copy of the GNU General Public License
#   along with this program. If not, see <http://www.gnu.org/licenses/>.

import os

from . import logger, isoLanguages, cover
from .constants import BookMeta

try:
    from wand.image import Image
    use_IM = True
except (ImportError, RuntimeError) as e:
    use_IM = False

log = logger.create()

try:
    from comicapi.comicarchive import ComicArchive, MetaDataStyle
    use_comic_meta = True
    try:
        from comicapi import __version__ as comic_version
    except ImportError:
        comic_version = ''
    try:
        from comicapi.comicarchive import load_archive_plugins
        import comicapi.utils
        comicapi.utils.add_rar_paths()
    except ImportError:
        load_archive_plugins = None
except (ImportError, LookupError) as e:
    log.debug('Cannot import comicapi, extracting comic metadata will not work: %s', e)
    import zipfile
    import tarfile
    try:
        import rarfile
        use_rarfile = True
    except (ImportError, SyntaxError) as e:
        log.debug('Cannot import rarfile, extracting cover files from rar files will not work: %s', e)
        use_rarfile = False
    try:
        import py7zr
        use_7zip = True
    except (ImportError, SyntaxError) as e:
        log.debug('Cannot import py7zr, extracting cover files from CB7 files will not work: %s', e)
        use_7zip = False
    use_comic_meta = False


def _extract_cover_from_archive(original_file_extension, tmp_file_name, rar_executable):
    cover_data = extension = None
    if original_file_extension.upper() == '.CBZ':
        cf = zipfile.ZipFile(tmp_file_name)
        for name in cf.namelist():
            ext = os.path.splitext(name)
            if len(ext) > 1:
                extension = ext[1].lower()
                if extension in cover.COVER_EXTENSIONS:
                    cover_data = cf.read(name)
                    break
    elif original_file_extension.upper() == '.CBT':
        cf = tarfile.TarFile(tmp_file_name)
        for name in cf.getnames():
            ext = os.path.splitext(name)
            if len(ext) > 1:
                extension = ext[1].lower()
                if extension in cover.COVER_EXTENSIONS:
                    cover_data = cf.extractfile(name).read()
                    break
    elif original_file_extension.upper() == '.CBR' and use_rarfile:
        try:
            rarfile.UNRAR_TOOL = rar_executable
            cf = rarfile.RarFile(tmp_file_name)
            for name in cf.namelist():
                ext = os.path.splitext(name)
                if len(ext) > 1:
                    extension = ext[1].lower()
                    if extension in cover.COVER_EXTENSIONS:
                        cover_data = cf.read([name])
                        break
        except Exception as ex:
            log.error('Rarfile failed with error: {}'.format(ex))
    elif original_file_extension.upper() == '.CB7' and use_7zip:
        cf = py7zr.SevenZipFile(tmp_file_name)
        for name in cf.getnames():
            ext = os.path.splitext(name)
            if len(ext) > 1:
                extension = ext[1].lower()
                if extension in cover.COVER_EXTENSIONS:
                    try:
                        cover_data = cf.read([name])[name].read()
                    except (py7zr.Bad7zFile, OSError) as ex:
                        log.error('7Zip file failed with error: {}'.format(ex))
                    break
    return cover_data, extension


def _extract_cover(tmp_file_name, original_file_extension, rar_executable):
    cover_data = extension = None
    if use_comic_meta:
        try:
            archive = ComicArchive(tmp_file_name, rar_exe_path=rar_executable)
        except TypeError:
            archive = ComicArchive(tmp_file_name)
        name_list = archive.getPageNameList if hasattr(archive, "getPageNameList") else archive.get_page_name_list
        for index, name in enumerate(name_list()):
            ext = os.path.splitext(name)
            if len(ext) > 1:
                extension = ext[1].lower()
                if extension in cover.COVER_EXTENSIONS:
                    get_page = archive.getPage if hasattr(archive, "getPageNameList") else archive.get_page
                    cover_data = get_page(index)
                    break
    else:
        cover_data, extension = _extract_cover_from_archive(original_file_extension, tmp_file_name, rar_executable)
    return cover.cover_processing(tmp_file_name, cover_data, extension)


def get_comic_info(tmp_file_path, original_file_name, original_file_extension, rar_executable):
    if use_comic_meta:
        try:
            archive = ComicArchive(tmp_file_path, rar_exe_path=rar_executable)
        except TypeError:
            load_archive_plugins(force=True, rar=rar_executable)
            archive = ComicArchive(tmp_file_path)
        if hasattr(archive, "seemsToBeAComicArchive"):
            seems_archive = archive.seemsToBeAComicArchive
        else:
            seems_archive = archive.seems_to_be_a_comic_archive
        if seems_archive():
            has_metadata = archive.hasMetadata if hasattr(archive, "hasMetadata") else archive.has_metadata
            if has_metadata(MetaDataStyle.CIX):
                style = MetaDataStyle.CIX
            elif has_metadata(MetaDataStyle.CBI):
                style = MetaDataStyle.CBI
            else:
                style = None

            read_metadata = archive.readMetadata if hasattr(archive, "readMetadata") else archive.read_metadata
            loaded_metadata = read_metadata(style)

            lang = loaded_metadata.language or ""
            loaded_metadata.language = isoLanguages.get_lang3(lang)

            return BookMeta(
                file_path=tmp_file_path,
                extension=original_file_extension,
                title=loaded_metadata.title or original_file_name,
                author=" & ".join([credit["person"]
                                   for credit in loaded_metadata.credits if credit["role"] == "Writer"]) or 'Unknown',
                cover=_extract_cover(tmp_file_path, original_file_extension, rar_executable),
                description=loaded_metadata.comments or "",
                tags="",
                series=loaded_metadata.series or "",
                series_id=loaded_metadata.issue or "",
                languages=loaded_metadata.language,
                publisher="",
                pubdate="",
                identifiers=[])

    return BookMeta(
        file_path=tmp_file_path,
        extension=original_file_extension,
        title=original_file_name,
        author='Unknown',
        cover=_extract_cover(tmp_file_path, original_file_extension, rar_executable),
        description="",
        tags="",
        series="",
        series_id="",
        languages="",
        publisher="",
        pubdate="",
        identifiers=[])
Import covers from comic files during upload 2017-12-02 16:33:55 +00:00			`# -- coding: utf-8 --`

Updated translations Added license texts in flies 2019-01-20 18:37:45 +00:00			`# This file is part of the Calibre-Web (https://github.com/janeczku/calibre-web)`
Improved cover extraction for epub files 2022-03-12 17:01:11 +00:00			`# Copyright (C) 2018-2022 OzzieIsaacs`
Updated translations Added license texts in flies 2019-01-20 18:37:45 +00:00			`#`
			`# This program is free software: you can redistribute it and/or modify`
			`# it under the terms of the GNU General Public License as published by`
			`# the Free Software Foundation, either version 3 of the License, or`
			`# (at your option) any later version.`
			`#`
			`# This program is distributed in the hope that it will be useful,`
			`# but WITHOUT ANY WARRANTY; without even the implied warranty of`
			`# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the`
			`# GNU General Public License for more details.`
			`#`
			`# You should have received a copy of the GNU General Public License`
			`# along with this program. If not, see <http://www.gnu.org/licenses/>.`

Import covers from comic files during upload 2017-12-02 16:33:55 +00:00			`import os`

Improved cover extraction for epub files 2022-03-12 17:01:11 +00:00			`from . import logger, isoLanguages, cover`
Merge branch 'Develop' # Conflicts: # MANIFEST.in # README.md # cps/helper.py # cps/static/js/archive/archive.js # cps/translations/nl/LC_MESSAGES/messages.mo # cps/translations/nl/LC_MESSAGES/messages.po # cps/ub.py # cps/updater.py # cps/web.py # cps/worker.py # optional-requirements.txt 2019-07-13 18:45:48 +00:00			`from .constants import BookMeta`

Remove Pillow as dependency 2020-12-09 13:18:39 +00:00			`try:`
			`from wand.image import Image`
			`use_IM = True`
			`except (ImportError, RuntimeError) as e:`
			`use_IM = False`

Improved cover extraction for epub files 2022-03-12 17:01:11 +00:00			`log = logger.create()`
Remove Pillow as dependency 2020-12-09 13:18:39 +00:00
Merge remote-tracking branch 'comicapi/master' 2019-05-30 08:43:28 +00:00			`try:`
			`from comicapi.comicarchive import ComicArchive, MetaDataStyle`
			`use_comic_meta = True`
Added ability to view comicapi version Changed required comicapi version Unified "cannot" and "Cannot" texts Removed annoying "was already removed" string from log 2020-05-23 14:20:19 +00:00			`try:`
			`from comicapi import __version__ as comic_version`
Fix #1727 (import rarfile 4.0 fails on python3.5) 2020-11-30 17:32:21 +00:00			`except ImportError:`
Added ability to view comicapi version Changed required comicapi version Unified "cannot" and "Cannot" texts Removed annoying "was already removed" string from log 2020-05-23 14:20:19 +00:00			`comic_version = ''`
Update optional requirements Update to be compatible with comicapi 3.2 2023-06-25 12:39:45 +00:00			`try:`
			`from comicapi.comicarchive import load_archive_plugins`
			`import comicapi.utils`
			`comicapi.utils.add_rar_paths()`
			`except ImportError:`
			`load_archive_plugins = None`
Fix for #1474 (old comicapi with installed unrar, but missing unrar-lib) 2020-06-07 13:41:53 +00:00			`except (ImportError, LookupError) as e:`
Added ability to view comicapi version Changed required comicapi version Unified "cannot" and "Cannot" texts Removed annoying "was already removed" string from log 2020-05-23 14:20:19 +00:00			`log.debug('Cannot import comicapi, extracting comic metadata will not work: %s', e)`
Merge remote-tracking branch 'comicapi/master' 2019-05-30 08:43:28 +00:00			`import zipfile`
			`import tarfile`
Renabled cbrimage extraction (via unrar and rarfile) 2020-04-28 14:50:08 +00:00			`try:`
			`import rarfile`
			`use_rarfile = True`
Fix #1727 (import rarfile 4.0 fails on python3.5) 2020-11-30 17:32:21 +00:00			`except (ImportError, SyntaxError) as e:`
Added ability to view comicapi version Changed required comicapi version Unified "cannot" and "Cannot" texts Removed annoying "was already removed" string from log 2020-05-23 14:20:19 +00:00			`log.debug('Cannot import rarfile, extracting cover files from rar files will not work: %s', e)`
Renabled cbrimage extraction (via unrar and rarfile) 2020-04-28 14:50:08 +00:00			`use_rarfile = False`
Added cb7 to supported comic files for upload and metadata extraction 2023-08-16 16:44:03 +00:00			`try:`
			`import py7zr`
			`use_7zip = True`
			`except (ImportError, SyntaxError) as e:`
			`log.debug('Cannot import py7zr, extracting cover files from CB7 files will not work: %s', e)`
			`use_7zip = False`
Merge remote-tracking branch 'comicapi/master' 2019-05-30 08:43:28 +00:00			`use_comic_meta = False`
Import covers from comic files during upload 2017-12-02 16:33:55 +00:00
Fix #985 (png and webp are extracted as cover files from comic files) 2020-05-02 09:24:30 +00:00
Improved cover extraction for epub files 2022-03-12 17:01:11 +00:00			`def _extract_cover_from_archive(original_file_extension, tmp_file_name, rar_executable):`
Update cover extraction with comicapi for webp files (fixes #2280) 2022-01-22 09:31:18 +00:00			`cover_data = extension = None`
Some code cosmetics 2021-03-14 12:28:52 +00:00			`if original_file_extension.upper() == '.CBZ':`
			`cf = zipfile.ZipFile(tmp_file_name)`
			`for name in cf.namelist():`
			`ext = os.path.splitext(name)`
			`if len(ext) > 1:`
			`extension = ext[1].lower()`
Improved cover extraction for epub files 2022-03-12 17:01:11 +00:00			`if extension in cover.COVER_EXTENSIONS:`
Some code cosmetics 2021-03-14 12:28:52 +00:00			`cover_data = cf.read(name)`
			`break`
			`elif original_file_extension.upper() == '.CBT':`
			`cf = tarfile.TarFile(tmp_file_name)`
			`for name in cf.getnames():`
			`ext = os.path.splitext(name)`
			`if len(ext) > 1:`
			`extension = ext[1].lower()`
Improved cover extraction for epub files 2022-03-12 17:01:11 +00:00			`if extension in cover.COVER_EXTENSIONS:`
Some code cosmetics 2021-03-14 12:28:52 +00:00			`cover_data = cf.extractfile(name).read()`
			`break`
			`elif original_file_extension.upper() == '.CBR' and use_rarfile:`
			`try:`
Improved cover extraction for epub files 2022-03-12 17:01:11 +00:00			`rarfile.UNRAR_TOOL = rar_executable`
Some code cosmetics 2021-03-14 12:28:52 +00:00			`cf = rarfile.RarFile(tmp_file_name)`
Bugfix for cbr support without comicapi 2022-02-19 09:04:21 +00:00			`for name in cf.namelist():`
Some code cosmetics 2021-03-14 12:28:52 +00:00			`ext = os.path.splitext(name)`
			`if len(ext) > 1:`
			`extension = ext[1].lower()`
Improved cover extraction for epub files 2022-03-12 17:01:11 +00:00			`if extension in cover.COVER_EXTENSIONS:`
Added cb7 to supported comic files for upload and metadata extraction 2023-08-16 16:44:03 +00:00			`cover_data = cf.read([name])`
Some code cosmetics 2021-03-14 12:28:52 +00:00			`break`
Code refactoring and improved error handling for edit user list Update teststatus 2021-04-04 17:40:34 +00:00			`except Exception as ex:`
Added cb7 to supported comic files for upload and metadata extraction 2023-08-16 16:44:03 +00:00			`log.error('Rarfile failed with error: {}'.format(ex))`
			`elif original_file_extension.upper() == '.CB7' and use_7zip:`
			`cf = py7zr.SevenZipFile(tmp_file_name)`
			`for name in cf.getnames():`
			`ext = os.path.splitext(name)`
			`if len(ext) > 1:`
			`extension = ext[1].lower()`
			`if extension in cover.COVER_EXTENSIONS:`
			`try:`
Fix for #3050 (metadata extraction for cb7 files not working) 2024-05-10 07:05:31 +00:00			`cover_data = cf.read([name])[name].read()`
Added cb7 to supported comic files for upload and metadata extraction 2023-08-16 16:44:03 +00:00			`except (py7zr.Bad7zFile, OSError) as ex:`
			`log.error('7Zip file failed with error: {}'.format(ex))`
			`break`
Update cover extraction with comicapi for webp files (fixes #2280) 2022-01-22 09:31:18 +00:00			`return cover_data, extension`
Some code cosmetics 2021-03-14 12:28:52 +00:00
Merge remote-tracking branch 'comicapi/master' 2019-05-30 08:43:28 +00:00
Improved cover extraction for epub files 2022-03-12 17:01:11 +00:00			`def _extract_cover(tmp_file_name, original_file_extension, rar_executable):`
Move a few variables around This should prevent a couple of crashes due to undeclared variables. 2020-04-27 10:03:54 +00:00			`cover_data = extension = None`
Merge remote-tracking branch 'comicapi/master' 2019-05-30 08:43:28 +00:00			`if use_comic_meta:`
Update optional requirements Update to be compatible with comicapi 3.2 2023-06-25 12:39:45 +00:00			`try:`
			`archive = ComicArchive(tmp_file_name, rar_exe_path=rar_executable)`
			`except TypeError:`
			`archive = ComicArchive(tmp_file_name)`
Fixes to word with new version of comicapi 2023-05-04 17:23:02 +00:00			`name_list = archive.getPageNameList if hasattr(archive, "getPageNameList") else archive.get_page_name_list`
			`for index, name in enumerate(name_list()):`
Bugfix for comicapi 2019-08-03 12:09:54 +00:00			`ext = os.path.splitext(name)`
			`if len(ext) > 1:`
			`extension = ext[1].lower()`
Improved cover extraction for epub files 2022-03-12 17:01:11 +00:00			`if extension in cover.COVER_EXTENSIONS:`
Fixes to word with new version of comicapi 2023-05-04 17:23:02 +00:00			`get_page = archive.getPage if hasattr(archive, "getPageNameList") else archive.get_page`
			`cover_data = get_page(index)`
Bugfix for comicapi 2019-08-03 12:09:54 +00:00			`break`
Merge remote-tracking branch 'comicapi/master' 2019-05-30 08:43:28 +00:00			`else:`
Improved cover extraction for epub files 2022-03-12 17:01:11 +00:00			`cover_data, extension = _extract_cover_from_archive(original_file_extension, tmp_file_name, rar_executable)`
			`return cover.cover_processing(tmp_file_name, cover_data, extension)`
Import covers from comic files during upload 2017-12-02 16:33:55 +00:00

Improved cover extraction for epub files 2022-03-12 17:01:11 +00:00			`def get_comic_info(tmp_file_path, original_file_name, original_file_extension, rar_executable):`
Merge remote-tracking branch 'comicapi/master' 2019-05-30 08:43:28 +00:00			`if use_comic_meta:`
Update optional requirements Update to be compatible with comicapi 3.2 2023-06-25 12:39:45 +00:00			`try:`
			`archive = ComicArchive(tmp_file_path, rar_exe_path=rar_executable)`
			`except TypeError:`
			`load_archive_plugins(force=True, rar=rar_executable)`
			`archive = ComicArchive(tmp_file_path)`
Fixes to word with new version of comicapi 2023-05-04 17:23:02 +00:00			`if hasattr(archive, "seemsToBeAComicArchive"):`
			`seems_archive = archive.seemsToBeAComicArchive`
			`else:`
			`seems_archive = archive.seems_to_be_a_comic_archive`
			`if seems_archive():`
			`has_metadata = archive.hasMetadata if hasattr(archive, "hasMetadata") else archive.has_metadata`
			`if has_metadata(MetaDataStyle.CIX):`
Merge remote-tracking branch 'comicapi/master' 2019-05-30 08:43:28 +00:00			`style = MetaDataStyle.CIX`
Fixes to word with new version of comicapi 2023-05-04 17:23:02 +00:00			`elif has_metadata(MetaDataStyle.CBI):`
Merge remote-tracking branch 'comicapi/master' 2019-05-30 08:43:28 +00:00			`style = MetaDataStyle.CBI`
			`else:`
			`style = None`
Import covers from comic files during upload 2017-12-02 16:33:55 +00:00
Fixes to word with new version of comicapi 2023-05-04 17:23:02 +00:00			`read_metadata = archive.readMetadata if hasattr(archive, "readMetadata") else archive.read_metadata`
			`loaded_metadata = read_metadata(style)`
Import covers from comic files during upload 2017-12-02 16:33:55 +00:00
Improved cover extraction for epub files 2022-03-12 17:01:11 +00:00			`lang = loaded_metadata.language or ""`
			`loaded_metadata.language = isoLanguages.get_lang3(lang)`
redid comic importing support to handle metadata properly using comicapi from comictagger. needs work to automate installation 2019-04-02 22:52:45 +00:00
Renabled cbrimage extraction (via unrar and rarfile) 2020-04-28 14:50:08 +00:00			`return BookMeta(`
Merge remote-tracking branch 'comicapi/master' 2019-05-30 08:43:28 +00:00			`file_path=tmp_file_path,`
			`extension=original_file_extension,`
Improved cover extraction for epub files 2022-03-12 17:01:11 +00:00			`title=loaded_metadata.title or original_file_name,`
Some code cosmetics 2021-03-14 12:28:52 +00:00			`author=" & ".join([credit["person"]`
Improved cover extraction for epub files 2022-03-12 17:01:11 +00:00			`for credit in loaded_metadata.credits if credit["role"] == "Writer"]) or 'Unknown',`
			`cover=_extract_cover(tmp_file_path, original_file_extension, rar_executable),`
			`description=loaded_metadata.comments or "",`
Merge remote-tracking branch 'comicapi/master' 2019-05-30 08:43:28 +00:00			`tags="",`
Improved cover extraction for epub files 2022-03-12 17:01:11 +00:00			`series=loaded_metadata.series or "",`
			`series_id=loaded_metadata.issue or "",`
			`languages=loaded_metadata.language,`
Add pubdate, publisher and identifiers metadata #2163 2022-04-05 00:26:35 +00:00			`publisher="",`
			`pubdate="",`
			`identifiers=[])`
Import covers from comic files during upload 2017-12-02 16:33:55 +00:00
Renabled cbrimage extraction (via unrar and rarfile) 2020-04-28 14:50:08 +00:00			`return BookMeta(`
			`file_path=tmp_file_path,`
			`extension=original_file_extension,`
			`title=original_file_name,`
Removed unnecessary Unicode "u" 2023-01-21 14:23:18 +00:00			`author='Unknown',`
Improved cover extraction for epub files 2022-03-12 17:01:11 +00:00			`cover=_extract_cover(tmp_file_path, original_file_extension, rar_executable),`
Renabled cbrimage extraction (via unrar and rarfile) 2020-04-28 14:50:08 +00:00			`description="",`
			`tags="",`
			`series="",`
			`series_id="",`
Upload pdf fixes: Handle no title Handle no author Fix import of more than one language Add missing pdf upload publisher handling 2021-03-17 18:06:51 +00:00			`languages="",`
Add pubdate, publisher and identifiers metadata #2163 2022-04-05 00:26:35 +00:00			`publisher="",`
			`pubdate="",`
			`identifiers=[])`