2013-06-25 5 views
0

узнать больше о веб-соскоб, я пытаюсь получить доступ непосредственно к видео файл здесь http://video.disney.com/watch/disneychannel-no-service-4df889ed3d82b43c9c01a272Прямой доступ к видео

Что такое прямая ссылка? И как вы это узнали?

UPDATE: после того, как после ответа ниже URL является http://cdn.videos.dolimg.com/channel_shortform/unknown/i29083/869089-tpr_hi29083_gdj-h264m_aac_848x480_904x96.mp4

Инспектор дает мне следующие «Строка запроса параметров».

app:w88_dolwa_prod02 
trckTp:trackvideo 
vendorLst:c,n,o 
lSwid:AA50B128-8C31-4B59-A487-019721763B4A 
pgVwId:cto-1372188161916-8691154154948 
fullPgNm:dcom|dch|watch:disneychannel-no-service-4df889ed3d82b43c9c01a272|disneychannel-no-service-4df889ed3d82b43c9c01a272 
arPgNm:na 
plgId:7173e513b73b5ca23f3b93fbb4664f0be83c0df8 
ua:Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/27.0.1453.116 Safari/537.36 
res:1440x900 
cod:32 
eventLst:e1,e73,e68 
categoryCd:dcom 
siteCd:dch 
brdcrums:watch:disneychannel-no-service-4df889ed3d82b43c9c01a272 
buId:4b90600fa5ba550f422a8ba2 
propId:4bdfd35102a87496bbe03d00 
buCd:dch 
mstCd:mic 
templateTp:watch 
ASSETID:0_y1nplyhi 
KSESSIONID:4ca7bebd-9389-893f-ed7a-de46a7d4928c 
KSESSIONSEQ:1 
KDPEVNT:percentReached 
KDPDAT_VALUE:0 
KDPDAT_PLAYHEAD:0 
ASSETNAME:vid|dch|dmms|shr|0_y1nplyhi|No Service 
AUTO:true 
KDPPROTO:Flash 
assetNm:vid|dch|dmms|shr|0_y1nplyhi|no service 
adPgNm:/7046/dch/mickey-mouse/video 
adSzLst:300x60,970x90,970x66,728x90 
url:http://video.disney.com/watch/disneychannel-no-service-4df889ed3d82b43c9c01a272 
urlDom:disney.com 
urlFDom:video.disney.com 
urlFDom1:video.disney.com/watch 
refUrl:na 
sessionData:no_dolWASessionData_cookie 
visitorData:no_dolWAVisitorData_cookie 
logStatus:lo|nr 
prevPgNm:dcom|dch|watch:disneychannel-no-service-4df889ed3d82b43c9c01a272|disneychannel-no-service-4df889ed3d82b43c9c01a272 
VIDLEN:210 
GENTIME:1372188203486 
GENTITLE:No Service | Mickey Mouse and Friends | Disney Video 
GENURL:http://video.disney.com/watch/disneychannel-no-service-4df889ed3d82b43c9c01a272 
DEVID:-1 
USRAGNT:Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/27.0.1453.116 Safari/537.36 
WIGID:1959 
BITRATE:1000 
KDPID:1959 
mediaSumm:vid|dch|dmms|shr|0_y1nplyhi|No Service--**--210--**--dch--**--0--**--1372188203486--**--S0L0 
accnt:disneyvideo2 
brndSeg: 

ответ

2

Это в последнем <script> тега, хранятся в виде JSON.

Я не работаю с Ruby, но вот как бы я это сделать:

  • Получить HTML вашей страницы.
  • Получить содержимое Последнее<script> тег.
  • JSON находится между двумя частями JavaScript:
    • Удалить this.Grill?Grill.burger= с самого начала.
    • Удалить :(function(){var a=document.getElementsByTagName("html")[0];a.setAttribute("class",a.getAttribute("class")+" grill-error")})() с конца.
  • Разберите JSON, и у вас есть все URL-адреса.
+0

Спасибо! Значит, это не показано в инспекторе? как я обычно могу распознать JSON? и как я могу узнать домен «http://cdn.videos.dolimg.com/», если другие примеры не были указаны? Я вижу, если vimeo следует аналогичной схеме, но пока такой удачи не существует. – user1297102

+1

@ user1297102: Нет надежного способа сделать это. Просто найдите URL-адреса видеофайлов в источнике. Если вы не можете их найти, откройте Wireshark и ищите HTTP GET-запросы, которые возвращают видеопомет. – Blender

+0

Спасибо за разъяснение и помощь. Никогда не использовался Wireshark, но это, вероятно, лучше, чем использование инспектора браузеров. – user1297102