A. Navigation internet (30 min)

a) Internet et le web

Rappel de cours : chaque système informatique sur Internet est identifié par une adresse IP constituée de plusieurs nombres. La norme actuelle, IPv4, utilise 4 entiers entre 0 et 255 (c'est-à-dire des entiers de 8 bits). Les systèmes communiquent entre eux selon le protocole TCP/IP de transport de données.

En pratique, ces communications servent à assurer plusieurs services dont nous allons voir quelques exemples (le web, le mail, le ssh). Certains de ces services sont gérés par ce qui était à l'origine des navigateurs web, qui sont maintenant multifonctions pour la plupart : Mozilla Firefox, Konqueror, Internet Explorer, Google Chrome, Safari, Opéra... Le service est précisé par ce qui précède "://" dans l'adresse de la barre d'adresse. Pour le web, ce préfixe est :

Différences entre site web sécurisé et non sécurisé dans la barre d'adresse

Par exemple, à la même adresse www.lirmm.fr, le laboratoire de recherche LIRMM propose une page non sécurisée http://www.lirmm.fr destinée aux visiteurs et une page sécurisée https://www.lirmm.fr destinée à ses membres pour accéder à leur boîte mail. A1Essayez de voir s'il existe un serveur webUn serveur web envoie des pages web au client qui le contacte, c'est à dire au visiteur connecté à l'adresse où le serveur est accessible sur la machine d'adresse IP 173.194.66.94 : http://173.194.66.94.

Si vous voulez en savoir plus sur une adresse IP :
  • vous pouvez utiliser un service WhoIS pour connaître le propriétaire de cette adresse. Pour trouver un site qui propose ce service, taper "IP lookup" ou "WhoIs" depuis un moteur de recherche.
  • la commande traceroute, en ligne de commande, permet de suivre le trajet des données depuis votre système jusqu'à une adresse donnée ; essayez par exemple : "traceroute 173.194.66.94".

Quand on passe la souris sur un lien hypertexte, l'icône de la souris change généralement d'apparence, et l'adresse du lien s'affiche dans la barre d'état au bas du navigateur. A2Regardez à quoi ressemblent les adresses des liens sous le bouton Recherche Google sur le site http://173.194.66.94. A3Ouvrez aussi la page http://www.google.fr, placez-vous sur les mêmes liens. Que constatez-vous ? Arrivez-vous à l'expliquer ? A4Cherchez un peu avant de lire l'explication ci-dessous.

Les adresses se terminent pareil mais commencent par http://173.194.66.94/ pour les premières et http://www.google.fr/ pour les secondes, on a déjà vu que ces deux adresses (la première, une adresse IP, et la seconde, un nom de domaine) étaient équivalents, reste donc à savoir pourquoi les liens d'une même page sont différents. En fait, ces liens sont codés comme des adresses relatives (rappelez-vous, au TP précédent, nous évoquions la similarité entre adresses de fichiers et URL), ils commencent donc à l'adresse affichée dans la barre d'adresse ! Vous pouvez le vérifier A5en enregistrant cette page sur votre espace personnel (FichierEnregistrer sous... depuis le navigateur) puis en ouvrant cette copie dans votre navigateur, et en passant à nouveau la souris sur ces liens.

Pour approfondir : qu'est-ce qui arrive à faire le lien entre un nom de domaine et une adresse IP, c'est à dire sachant que vous voulez aller sur le site google.fr vous renvoie à l'adresse IP 173.194.66.94 ? C'est le serveur DNS. Il est possible de louer un nom de domaine pour l'associer à une adresse IP : ce service est assuré par un registrar moyennant une dizaine d'euros par an. Comment savoir quelle est l'IP du serveur qui héberge un site web ? Essayez ping google.fr dans la ligne de commande !

b) Le navigateur web

Navigateur web

Dans ce qui suit, identifiez les boutons mentionnés sur le navigateur que vous utilisez. Ils devraient être similaires à ceux de Firefox de la copie d'écran annotée ci-dessus.

Le bouton d'arrêt sert à stopper un chargement trop long d'une page (la barre d'état du navigateur informe de l'état du chargement de la page). A6Utilisez-le sur cette page qui contient de nombreuses images. Si le chargement est trop rapide pour que vous ayez le temps de l'arrêter, appuyez sur la touche F5 pour recommencer le chargement de la page (rafraîchir), voire réessayez sur cette page avec encore plus d'images.

A7Utilisez le bouton Page précédente pour remonter dans l'historique des pages que vous avez visitées, vous appuierez alors sur Page suivante juste à la droite du précédent, pour revenir à cette page. Au lieu de cliquer sur Page précédente, il est possible de presser la touche Retour arrière, ou simultanément les touches ALT et flèche gauche (ALT flèche droite pour atteindre la page suivante) selon le navigateur utilisé.

Utilisez la molette (entre les deux boutons de la souris) pour faire défiler cette page web. Utiliser la molette en appuyant sur la touche CTRL vous permet de changer la taille des caractères.

Dans le menu FichierNouveau, on constate qu'il est possible d'avoir une nouvelle fenêtre ou un nouvel onglet. A8Demandez un nouvel onglet. L'ensemble des onglets actuels, un petit rectangle par onglet (donc deux pour l'instant dans cet exercice), apparaît sur une même ligne. On peut se promener entre onglets en cliquant sur le représentant de l'onglet. Il est nettement plus avantageux d'ouvrir de nouveaux onglets ou de nouvelles fenêtres dans le même navigateur plutôt que de revenir en arrière (trop) souvent. Vous pouvez aussi choisir d'ouvrir un lien hypertexte dans un nouvel onglet en choisissant cette option dans le menu contextuel qui apparaît en cliquant du droit sur ce lien, ou directement en cliquant sur ce lien avec le bouton du milieu.

c) Pages non html

Le format conçu pour représenter les pages web, avec notamment le système de liens hypertextes, est le HTML. Vous pouvez en avoir un aperçu en choisissant d'afficher le code source d'une page web que vous visitez (CTRL U sous Firefox). Une initiation à ce langage (ou plutôt une variante plus récente) sera proposée au TP7 pour vous apprendre les bases sur la création de pages web.

Certains documents sont proposés sur la toile dans des formats non html, souvent PDF (Portable Document Format, comme les pages de cours accessibles depuis le menu à gauche de cette page web) ou DOC (Microsoft Word) pour les documents textuels, et divers formats d'images et sons. Tout navigateur fait de son mieux pour afficher ou jouer ces pages, à l'aide de plugins, mais il est évident que pour un format inconnu du navigateur on n'a que la possibilité de sauvegarder le document, en espérant disposer ailleurs ou bientôt de l'outil permettant de traiter tout nouveau format.

d) Gestion des marque-pages

A9Cliquez sur Marque-pages (aussi appelés favoris dans Internet Explorer, ou signets, bookmarks en anglais) pour constater qu'il est possible de gérer ces éléments. A10Sélectionnez "Afficher tous les marque-pages puis créez un dossier de signets GLIN102 et déposez-y un pointeur sur cette page et sur celle de la première séance.

e) Les cookies

Certains sites déposent des cookies, ensemble d'informations manipulables ensuite pas un serveur distant. Il est difficile de les refuser systématiquement sous peine de se voir refuser de transférer le document. En revanche, un nettoyage systématique de ces traces est conseillé, accessible depuis le menu OutilsOptions (ou ÉditionPréférences, ou un menu similaire). A11Explorez ce menu, notamment les multiples onglets, pour voir tout ce que vous pouvez configurer dans un navigateur web. Attention à ce que vous changez !

Approfondir sur vos droits concernant les informations personnelles que vous laissez sur internet : consultez le site de la CNIL pour plus d'informations sur votre droit de consultation et de rectification des données vous concernant. Attention toutefois, gardez toujours à l'esprit que les traces que vous laissez sur internet peuvent-être :
  • utilisées par les sites web visités pour établir un profil de votre comportement sur internet, ces informations pouvant être fournies à d'autres sites web,
  • laissées à disposition sur internet si vous les avez entrées pour vous inscrire à un site. Elles pourraient alors être affichées sur un moteur de recherche lorsqu'on y cherche votre nom.

f) Cache et proxy

Le cache permet de conserver sur le disque dur de l'ordinateur des pages visitées, et le navigateur regarde cet espace d'abord avant d'aller chercher tout document sur la toile, pour aller plus vite. Attention, si l'auteur de la page a fait une mise à jour, il est possible que le fait que l'ancienne version soit dans le cache bloque le téléchargement de la nouvelle version. Si vous soupçonnez que c'est le cas, appuyez sur F5 pour forcer le rechargement de la page. L'espace correspondant au cache est mis à une taille nulle par défaut.

Attention : la taille du cache est inclue dans le quota disque (donc si vous l'augmentez, votre quota espace restant diminue).

Un proxy fonctionne sur le même principe de base qu'un cache : il sert à stocker des pages web pour accélérer leur chargement, pas au niveau d'un ordinateur, mais d'un réseau local. Par exemple, le temps de transmission d'informations entre deux ordinateurs du réseau local de l'université est court, plus en tout cas que d'un ordinateur de l'université à un ordinateur extérieur. Ainsi, si vous demandez une page à l'extérieur, une machine de l'université, située entre la vôtre et l'extérieur, va vérifier qu'elle ne contient pas déjà la page, et ira la chercher à l'extérieur seulement si ce n'est pas le cas (ou bien qu'elle a été mise à jour depuis). Évidemment, ceci devient inutile pour des pages web hébergées sur des machines de l'université. Ainsi, le proxy est utilisé seulement pour atteindre les pages web extérieures.

Il faut donc indiquer au navigateur qu'il doit passer par le proxy pour atteindre l'extérieur, et charger directement les pages situées à l'intérieur du réseau local.

Observer les paramètres réseaux (dans Firefox : menu ÉditionPréférences → onglet Avancé → sous-onglet Réseau → bouton Paramètres).


Sous Windows

Les navigateurs web à votre disposition sur le système Windows sont Internet Explorer ou Mozilla Firefox (icônes sur le bureau ou accessibles par le Menu DémarrerTous les programmes). Les liens favoris (marque-pages) ne sont pas les mêmes que ceux de votre navigateur sur le système Linux : il s'agit de programmes différents, ayant chacun son paramétrage et ses réglages.