Merge pull request #6790 from remitamine/tele13
[canal13cl] fix info extraction
This commit is contained in:
		| @@ -78,7 +78,6 @@ from .camdemy import ( | |||||||
|     CamdemyIE, |     CamdemyIE, | ||||||
|     CamdemyFolderIE |     CamdemyFolderIE | ||||||
| ) | ) | ||||||
| from .canal13cl import Canal13clIE |  | ||||||
| from .canalplus import CanalplusIE | from .canalplus import CanalplusIE | ||||||
| from .canalc2 import Canalc2IE | from .canalc2 import Canalc2IE | ||||||
| from .cbs import CBSIE | from .cbs import CBSIE | ||||||
| @@ -648,6 +647,7 @@ from .teachingchannel import TeachingChannelIE | |||||||
| from .teamcoco import TeamcocoIE | from .teamcoco import TeamcocoIE | ||||||
| from .techtalks import TechTalksIE | from .techtalks import TechTalksIE | ||||||
| from .ted import TEDIE | from .ted import TEDIE | ||||||
|  | from .tele13 import Tele13IE | ||||||
| from .telebruxelles import TeleBruxellesIE | from .telebruxelles import TeleBruxellesIE | ||||||
| from .telecinco import TelecincoIE | from .telecinco import TelecincoIE | ||||||
| from .telegraaf import TelegraafIE | from .telegraaf import TelegraafIE | ||||||
|   | |||||||
| @@ -1,48 +0,0 @@ | |||||||
| # coding: utf-8 |  | ||||||
| from __future__ import unicode_literals |  | ||||||
|  |  | ||||||
| import re |  | ||||||
|  |  | ||||||
| from .common import InfoExtractor |  | ||||||
|  |  | ||||||
|  |  | ||||||
| class Canal13clIE(InfoExtractor): |  | ||||||
|     _VALID_URL = r'^http://(?:www\.)?13\.cl/(?:[^/?#]+/)*(?P<id>[^/?#]+)' |  | ||||||
|     _TEST = { |  | ||||||
|         'url': 'http://www.13.cl/t13/nacional/el-circulo-de-hierro-de-michelle-bachelet-en-su-regreso-a-la-moneda', |  | ||||||
|         'md5': '4cb1fa38adcad8fea88487a078831755', |  | ||||||
|         'info_dict': { |  | ||||||
|             'id': '1403022125', |  | ||||||
|             'display_id': 'el-circulo-de-hierro-de-michelle-bachelet-en-su-regreso-a-la-moneda', |  | ||||||
|             'ext': 'mp4', |  | ||||||
|             'title': 'El "círculo de hierro" de Michelle Bachelet en su regreso a La Moneda', |  | ||||||
|             'description': '(Foto: Agencia Uno) En nueve días más, Michelle Bachelet va a asumir por segunda vez como presidenta de la República. Entre aquellos que la acompañarán hay caras que se repiten y otras que se consolidan en su entorno de colaboradores más cercanos.', |  | ||||||
|         } |  | ||||||
|     } |  | ||||||
|  |  | ||||||
|     def _real_extract(self, url): |  | ||||||
|         mobj = re.match(self._VALID_URL, url) |  | ||||||
|         display_id = mobj.group('id') |  | ||||||
|  |  | ||||||
|         webpage = self._download_webpage(url, display_id) |  | ||||||
|  |  | ||||||
|         title = self._html_search_meta( |  | ||||||
|             'twitter:title', webpage, 'title', fatal=True) |  | ||||||
|         description = self._html_search_meta( |  | ||||||
|             'twitter:description', webpage, 'description') |  | ||||||
|         url = self._html_search_regex( |  | ||||||
|             r'articuloVideo = \"(.*?)\"', webpage, 'url') |  | ||||||
|         real_id = self._search_regex( |  | ||||||
|             r'[^0-9]([0-9]{7,})[^0-9]', url, 'id', default=display_id) |  | ||||||
|         thumbnail = self._html_search_regex( |  | ||||||
|             r'articuloImagen = \"(.*?)\"', webpage, 'thumbnail') |  | ||||||
|  |  | ||||||
|         return { |  | ||||||
|             'id': real_id, |  | ||||||
|             'display_id': display_id, |  | ||||||
|             'url': url, |  | ||||||
|             'title': title, |  | ||||||
|             'description': description, |  | ||||||
|             'ext': 'mp4', |  | ||||||
|             'thumbnail': thumbnail, |  | ||||||
|         } |  | ||||||
							
								
								
									
										81
									
								
								youtube_dl/extractor/tele13.py
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										81
									
								
								youtube_dl/extractor/tele13.py
									
									
									
									
									
										Normal file
									
								
							| @@ -0,0 +1,81 @@ | |||||||
|  | # coding: utf-8 | ||||||
|  | from __future__ import unicode_literals | ||||||
|  |  | ||||||
|  | from .common import InfoExtractor | ||||||
|  | from .youtube import YoutubeIE | ||||||
|  | from ..utils import ( | ||||||
|  |     js_to_json, | ||||||
|  |     qualities, | ||||||
|  |     determine_ext, | ||||||
|  | ) | ||||||
|  |  | ||||||
|  |  | ||||||
|  | class Tele13IE(InfoExtractor): | ||||||
|  |     _VALID_URL = r'^http://(?:www\.)?t13\.cl/videos(?:/[^/]+)+/(?P<id>[\w-]+)' | ||||||
|  |     _TESTS = [ | ||||||
|  |         { | ||||||
|  |             'url': 'http://www.t13.cl/videos/actualidad/el-circulo-de-hierro-de-michelle-bachelet-en-su-regreso-a-la-moneda', | ||||||
|  |             'md5': '4cb1fa38adcad8fea88487a078831755', | ||||||
|  |             'info_dict': { | ||||||
|  |                 'id': 'el-circulo-de-hierro-de-michelle-bachelet-en-su-regreso-a-la-moneda', | ||||||
|  |                 'ext': 'mp4', | ||||||
|  |                 'title': 'El círculo de hierro de Michelle Bachelet en su regreso a La Moneda', | ||||||
|  |             }, | ||||||
|  |             'params': { | ||||||
|  |                 # HTTP Error 404: Not Found | ||||||
|  |                 'skip_download': True, | ||||||
|  |             }, | ||||||
|  |         }, | ||||||
|  |         { | ||||||
|  |             'url': 'http://www.t13.cl/videos/mundo/tendencias/video-captan-misteriosa-bola-fuego-cielos-bangkok', | ||||||
|  |             'md5': '867adf6a3b3fef932c68a71d70b70946', | ||||||
|  |             'info_dict': { | ||||||
|  |                 'id': 'rOoKv2OMpOw', | ||||||
|  |                 'ext': 'mp4', | ||||||
|  |                 'title': 'Shooting star seen on 7-Sep-2015', | ||||||
|  |                 'description': 'md5:7292ff2a34b2f673da77da222ae77e1e', | ||||||
|  |                 'uploader': 'Porjai Jaturongkhakun', | ||||||
|  |                 'upload_date': '20150906', | ||||||
|  |                 'uploader_id': 'UCnLY_3ezwNcDSC_Wc6suZxw', | ||||||
|  |             }, | ||||||
|  |             'add_ie': ['Youtube'], | ||||||
|  |         } | ||||||
|  |     ] | ||||||
|  |  | ||||||
|  |     def _real_extract(self, url): | ||||||
|  |         display_id = self._match_id(url) | ||||||
|  |         webpage = self._download_webpage(url, display_id) | ||||||
|  |  | ||||||
|  |         setup_js = self._search_regex(r"(?s)jwplayer\('player-vivo'\).setup\((\{.*?\})\)", webpage, 'setup code') | ||||||
|  |         sources = self._parse_json(self._search_regex(r'sources\s*:\s*(\[[^\]]+\])', setup_js, 'sources'), display_id, js_to_json) | ||||||
|  |  | ||||||
|  |         preference = qualities(['Móvil', 'SD', 'HD']) | ||||||
|  |         formats = [] | ||||||
|  |         urls = [] | ||||||
|  |         for f in sources: | ||||||
|  |             format_url = f['file'] | ||||||
|  |             if format_url and format_url not in urls: | ||||||
|  |                 ext = determine_ext(format_url) | ||||||
|  |                 if ext == 'm3u8': | ||||||
|  |                     m3u8_formats = self._extract_m3u8_formats(format_url, display_id, 'mp4', 'm3u8_native', m3u8_id='hls', fatal=False) | ||||||
|  |                     if m3u8_formats: | ||||||
|  |                         formats.extend(m3u8_formats) | ||||||
|  |                 elif YoutubeIE.suitable(format_url): | ||||||
|  |                     return self.url_result(format_url, 'Youtube') | ||||||
|  |                 else: | ||||||
|  |                     formats.append({ | ||||||
|  |                         'url': format_url, | ||||||
|  |                         'format_id': f.get('label'), | ||||||
|  |                         'preference': preference(f.get('label')), | ||||||
|  |                         'ext': ext, | ||||||
|  |                     }) | ||||||
|  |                 urls.append(format_url) | ||||||
|  |         self._sort_formats(formats) | ||||||
|  |  | ||||||
|  |         return { | ||||||
|  |             'id': display_id, | ||||||
|  |             'title': self._search_regex(r'title\s*:\s*"([^"]+)"', setup_js, 'title'), | ||||||
|  |             'description': self._html_search_meta('description', webpage, 'description'), | ||||||
|  |             'thumbnail': self._search_regex(r'image\s*:\s*"([^"]+)"', setup_js, 'thumbnail', default=None), | ||||||
|  |             'formats': formats, | ||||||
|  |         } | ||||||
		Reference in New Issue
	
	Block a user
	 remitamine
					remitamine