User Tools

Site Tools


zz_deprecated:infojobs_spider

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
Last revisionBoth sides next revision
infojobs_spider [2012/02/23 14:53] dodgerzz_deprecated:infojobs_spider [2019/07/18 07:17] – external edit 127.0.0.1
Line 1: Line 1:
 +====== Infojobs Spyder ======
 +
 +
 ====== Descripcion ====== ====== Descripcion ======
 Este script accede a infojobs basándose en una URL predefinida y recorre los identificadores, enviando únicamente los que no ha sido publicados previamente. Este script accede a infojobs basándose en una URL predefinida y recorre los identificadores, enviando únicamente los que no ha sido publicados previamente.
Line 4: Line 7:
  
 ====== Instrucciones ====== ====== Instrucciones ======
 +Para que el script funcione, hay que crear el fichero de configuración, el script buscará en su propio directorio los ficheros *.conf para ejecutarlos todos (multiples búsquedas/usuarios). 
 +Para obtener la URL de búsqueda, hay que usar alguna extensión que capture los headers que lanza infojobs cuando se ejecuta la misma y luego cambiar la variable o bien, mirar la página de búsqueda y ver que categorías/subcategorías queremos y añadirlas a la URL. 
 +Como variables a tener en cuenta de la URL: 
 +^ Variable ^ Descripcion ^ 
 +| <code>inicio=1</code> | No tocarla, es la primera página :P | 
 +| <code>resultados=1000</code> | Número de resultados que nos muestra la primera página | 
 +| <code>subcategoria</code> | Las subcategorías, si se usa un conversor html a ascii se verán los caracteres "normales" |
  
 ===== Dependencias ===== ===== Dependencias =====
Line 10: Line 19:
   * bash >= 3.0   * bash >= 3.0
   * wget   * wget
 +
 +===== Config File =====
 +<file config krruke.conf>
 +SEARCHURL='https://www.infojobs.net/jobsearch/search-results/list.xhtml?palabra=&of_area=150&of_pais=17&of_provincia=9&tipo_contrato=0&remuneracion_minima=0&remuneracion_maxima=0&remuneracion_formato=0&antiguedad=2&experiencia=0&ett=true&seleccion=true&inicio=1&inicio=1&&orden=10&poblacion=&nivel_estudios=0&jornada_laboral=0&subcategoria=3114%2C3113%2C3106%2C3107%2C3105%2C3110%2C3111%2C3108%2C3124%2C3109&origen_busqueda=8&origen_accion=4&canal=0&query_id=12573539010&poblacionIdGEO=0&poblacionGEO=&radioGEO=0&upsellings=false'
 +DBFILE="/home/user/jobs_mailer/user.db"
 +MAIL="user@monguimail.com"
 +</file>
  
 ===== Script ===== ===== Script =====
Line 88: Line 104:
 done done
 </file> </file>
-===== Config File ===== + 
-<file config krruke.conf+ 
-SEARCHURL='https://www.infojobs.net/jobsearch/search-results/list.xhtml?palabra=&of_area=150&of_pais=17&of_provincia=9&tipo_contrato=0&remuneracion_minima=0&remuneracion_maxima=0&remuneracion_formato=0&antiguedad=2&experiencia=0&ett=true&seleccion=true&inicio=1&resultados=1000&orden=10&poblacion=&nivel_estudios=0&jornada_laboral=0&subcategoria=3114%2C3113%2C3106%2C3107%2C3105%2C3110%2C3111%2C3108%2C3124%2C3109&origen_busqueda=8&origen_accion=4&canal=0&query_id=12573539010&poblacionIdGEO=0&poblacionGEO=&radioGEO=0&upsellings=false' +===== Programación ===== 
-DBFILE="/home/root/jobs_mailer/oyerpes.db" +Mediante cron se pueden lanzar el script: 
-MAIL="krruke@gmail.com" +<code
-</file>+0,30    09-20               1-5             /home/root/jobs_mailer/mail_jobs-02.sh 
 +</code>