PROJET AUTOBLOG


le hollandais volant links

Site original : le hollandais volant links

⇐ retour index

EU Disinfolab et le RGPD : interview de Me Oriana Labruyère

mardi 28 août 2018 à 16:32

Une interview qui décrit un peu ce qui va se passer maintenant suite à cette affaire.


— (permalink)

La machine à inventer des mots - le hollandais volant

lundi 27 août 2018 à 19:52

Voilàààà.

J’ai enfin réussi à implémenter l’idée (géniale) de David Louapre (de Science-Étonnante).

C’est un générateur de mots.

Mais contrairement à un truc simple qui sort des lettres au hasard, ou même une simple alternance voyelle/consonne, ce script utilise une table de probabilités qu’ont les lettres de ses suivre les unes des autres.

C’est pour cette simple raison que les mots produits ici sonnent si bien (à noter par contre qu’il reste difficile de les lire : on hésite dessus, car ils sont inédits. Si cela montre une chose, c’est qu’à force de lire, on ne lit plus des lettres, mais vraiment des mots, ce qui est plus rapide).

Par exemple, en Français, le « q » est généralement suivi d’un « u » (à 99,005 % du temps sur certains tests – le reste du temps il est suivi d’un « a » (dans Qatar), d’un autre « q » (Saqqarah) ou d’un « n » (dans le sigle LQDN, présent dans mon dictionnaire !).

Je produits une table de probabilités pour toutes les lettres, suivies de toutes les autres.

Pour de meilleurs résultats, comme le conseille d’ailleurs David dans son article, le script analyse des séquences de 3 lettres, les lettres de début, et de fin.
Pour le Français, mon script utilise environ 80 000 mots pour construire cette table de probabilités.

Dans cet outil, le script qui produit la table n’est pas présente (elle sera publiée prochainement). Le script récupère juste la table puis construit des mots.

J’ai fait les tables pour diverses langues (français, allemand, islandais, suédois, norvégien, néerlandais, anglais, letton, italien, danois, espagnol, slovaque, portugais, albanais, ukrainien (ce dernier est en cyrillique)).

Notez que les diacritiques (éàèçâæ…) sont également pris en compte, ainsi que les caractères spécifiques à ces langues.

Je voulais ajouter d’autres langues (polonais, grec, tchèque…), mais JavaScript supporte mal l’unicode et en l’occurence… ces langues ne passent pas. D’ailleurs, certains caractères ne marchent tout simplement pas dans Unicode avec SublimeText ou Xed, donc je laisse tomber pour le moment.

J’aimerais aussi ajouter le japonais (katakanas) et le coréen (hangul). Les kana ça va être simple (si JS supporte), les hangeul un peu moins (il faudra décomposer les han, faire les tables, produire les mots, et reconstruire les han. On pourrait aussi supporter tous les han, mais le tableau serait beaucoup trop gros — là aussi, à condition que JS supporte ça).


— (permalink)

King Louis IX - WTF fun facts

lundi 27 août 2018 à 16:20

Ceux qui disent que Macron régresse la société de 50 ans ont tout faux. C’est de 800 ans qu’il la recule !


— (permalink)

VIDEO. Le pape recommande la psychiatrie pour l'homosexualité décelée à l'enfance

lundi 27 août 2018 à 12:37

Et pour ceux qui ont des amis imaginaire, c'est quoi ?


— (permalink)

La crème pare-balles n'a pas été un franc succès pour son inventeur

jeudi 23 août 2018 à 16:51

La version moderne, c’est l’homéophile qui veut guérrir d’une maladie grave : « mais siiii, ça va marcher, vous allez voir » et à la fin il meurt.


— (permalink)

Balance Ton Youtuber... - YouTube

jeudi 23 août 2018 à 16:15

Je ne connais pas ce youtubeur, et j’ai jamais vu une de ses vidéos, mais apparemment la presse française a encore frappée et diffamé. Je me permets de relayer.

Encore ? Ouais : https://lehollandaisvolant.net/?d=2015/11/09/18/40/37-a-propos-du-business-trouble-sur-youtube-selon-lemonde

Et après les journaux se plaignent que leur revenus baissent ? Qu’ils disparaissent.


— (permalink)

Kimetrak ? Le Figaro, Korben et Next INpact entre autres – Denis Szalkowski Formateur Consultant

jeudi 23 août 2018 à 09:38

Très amusant, de la part d'un site qui utilise AMP, par Google sur les mobile. Vraiment.
Mais bon, on a l'habitude avec DSFC.

Sinon, dans le cas de Next INpact, ils ont effectivement construit leur propre régie de pub. Libre à quiconque de la bloquer ou de leur faire confiance. On peut aussi s'abonner et là y'a plus aucun trackeur.

Enfin, et là où c'est drôle, c'est que personne n'a besoin d'un trackeur tiers pour vendre nos données. Le site peut très bien avoir son propre script, sur son domaine, qui va envoyer les données sur son serveur ; et c'est ensuite le serveur qui communique avec Google ou autre. Aucun Ad-block n'y verrait rien.


— (permalink)

Note : optimiser les boucles en programmation

mercredi 22 août 2018 à 23:59

J’ai décidé d’implémenter ça : https://sciencetonnante.wordpress.com/2015/11/06/la-machine-a-inventer-des-mots-version-ikea/ en javascript (pour un faire un petit générateur de mots dans une page web).

Y a une chose sur laquelle je reviens, et c’est pas la première fois, et ça semble trivial, mais ça change tout.

Dans ce script, en gros, j’ai 80 000 mots et je chercher les occurrences de triplets de lettres là-dedans. Donc en fait, j’ai 3 boucles imbriquées (de A à Z) sur chacun des 80 000 mots.

Question tout con : quel est le plus rapide,
– boucler sur les mots, puis sur les lettres ?
Comme ça :

for (w in words) {
    for (i in alphabet) {
        for (j in alphabet) {
            for (k in alphabet) {
                check(ijk, w)
            }
        }
    }
}

– boucler sur les lettres puis les mots ?
Comme ceci :

for (i in alphabet) {
    for (j in alphabet) {
        for (k in alphabet) {
            for (w in words) {
                check(ijk, w)
            }
        }
    }
}

Mathématiquement, dans les deux cas, on fait 80 000 × 26³ = 1,4 milliards de boucles.

Pourtant, avec une toute petite astuce, on peut rendre le premier code beaucoup plus rapide.
L’idée est qu’il y a 26 lettres dans l’alphabet. Mais les mots font rarement 26 lettres, et quand ils le font, c’est rarement avec toutes les lettres.

On va donc, à chaque boucle, commencer par vérifier si la lettre sur laquelle on est est contenue dans le mot.
Si il n’y est pas, c’est inutile de faire les deux autre boucles internes : la suite contenant la première lettre n’y sera pas non plus. Dans ce cas, on économise 26² boucles pour ce mot :

for (w in words) {
    for (i in alphabet) {
        if (check(i, w)) {
            for (j in alphabet) {
                if (check(ij, w)) {
                    for (k in alphabet) {
                        check(ijk, w)
                    }
                }
            }
        }
    }
}

Sachant que les mots font autour de ~8 lettres, ça représente (26-8)×26² = 12 168 boucles par mot !

Du coup, au lieu de 1,4 milliards de boucles, on réduit ça directement à 432 millions.
Ensuite, on économise encore sur le test de la chaîne "ij" (si la seconde lettre "j" ne se trouve pas dans le mot, alors on économise 26 boucles par mot : on passe en dessous des 400 millions.

La différence est grande : on a divisé le temps par 3~4 juste avec ça.
Et ça c’est juste une estimation grossière : en français, les mots — surtout les longs — ont plutôt des lettres en doubles que seulement des lettres différentes.

En pratique, je passe d’un temps d’éxécution de ~2 minutes à seulement 3 secondes… J’ai divisé le temps par 40.

Tout ceci est tout bête, tout con, mais pensez-y : parfois une ligne de code en plus, un simple "if" juste avant une fonction lourde peut tout changer.
Ok, fait un test « if » c’est une condition en plus et donc un calcul en plus. Mais si ça permet d’économiser sur une fonction qui prend 40 fois plus de temps… Alors ça en vaut la même. En l’occurrence, si ma fonction prend vraiment 40 fois plus de temps qu’un "if", alors je serait gagnant dès qu’on mot fait moins de 25 lettres différentes, ce qui est toujours le cas en français.

%%

Autre exemple dans mon code : pour faire le teste de présence d’un triple de lettres consécutifs dans un mot, j’utilisais les regex. C’est lourd et lent.
À la place, j’ai opté pour une fonction avec un simple "str.indexOf()", qui regarde si une souschaîne est contenue dans une chaîne. C’est bien plus rapide qu’un regex. Là, le temps a été divisé par un facteur 100 environ.

Sur une page normale, j’imagine qu’on n’aurait gagné que des micro-secondes. Mais quand on boucle 26³ fois sur chacun de 80 000 mots, le gain de temps est monstre.

Women's Pockets are Inferior.

mercredi 22 août 2018 à 15:53

Sur les pantalons, les poches sont environ moitié moins grande sur tailles "femme" que sur les tailles "homme". D’après cet article, on peut tout juste y mettre un smartphone 5", et pas ses mains.

Non seulement c’est ridicule, mais surtout… pourquoi ?

D’après l’article (à la fin), ça serait une question de mode… wtf


— (permalink)

space: The Next Trillion Dollar Industry - YouTube

mercredi 22 août 2018 à 10:58

De nouveau, un exemple pourquoi "permettre l'accès à l'espace aux entreprises privées" :

- N'EST PAS synonyme de "je laisse tel ou tel milliardaire tuer des éléphants sur Mars durant son temps libre"
- N'EST PAS nouveau : ça fait des décennies que des entreprises privées possèdent des satellites en orbite, ne serait-ce que pour faire les cartes routière, diffuser des émissions de TV, permettre des télécommunications satellites (pour info : Google Maps utilise des photos prises par des satellite privés, et OSM également)
- enfin, ce que les gouvernements ne payent pas pour envoyer dans l'espace, ils ont des contrats avec ces entreprises privées.

Et ça ce sont juste 3 exemple. Tout ceci n'est que le début.
Si un satellite classique fait la taille d'un bus, désormais, on peut en faire de la taille d'une boîte à chaussures ou moins.

Après le secteur maritime (qui a placé nos villes depuis l'antiquité, qui a fondé nombre de forêts en France jusqu'à Louis XIV), le secteur de l'acier qui a permis les chemins de fer au XIX, celui de l'automobile, de l'aviation, de l'énergie, des ordinateurs et de l'internet, toutes ces choses ayant été fait par et au service des militaires avant des gens et des entreprises privées, c'est au tour de l'espace de le devenir. Get. Over. It.


— (permalink)

City - Liens en vrac de sebsauvage

lundi 20 août 2018 à 17:52

Ces couleurs… ça m’a fait penser à cette série de fond d’écrans « japan apocalypse » : http://gakuran.com/post-apocalyptic-images-of-japan/

(ce qui, btw, n’est pas bien différent des stades olympiques ou de football qui sont abandonnés une fois que l’évènement est passé : https://www.bbc.co.uk/bbcthree/article/de4004d3-97e8-467c-89a9-03290074e34a )


— (permalink)

Il me restait des oeufs... - Liens en vrac de sebsauvage

lundi 20 août 2018 à 17:48

Y a un XKCD pour ça : https://xkcd.com/140/ :D


— (permalink)

Un iPad s'enflamme dans l'Apple Store d'Amsterdam - Tech - Numerama

lundi 20 août 2018 à 17:32

Les dernièrs iPad ont une batterie de 32,4 Wh, soit 116 640 joules.

Une grenade à main c’est à peu près le même ordre de grandeur d’énergie : 251 000 joules pur la grenade F1 russe.

Normalement, un iPad libère son énergie très lentement, mais en cas de soucis, tout est libérer d’un seul coup et ça exploser, avec des dégâts assez important : explosion, incendie…


— (permalink)

Debunker des Etoiles sur Twitter : "Bonjour @Youtube, Dis ça te dirait de mettre autant d'entrain à chasser les nazis sur ta plateforme qu'à faire chier les vidéastes pour quelques secondes de droit d'auteur ?… https://t.co/dernJoTa93"

lundi 20 août 2018 à 17:14

Lol @youtube : ils emmerdent le monde pour 3 secondes de copyreich, par contre un compte nommé « partie royaliste national socialiste » avec des croix gammées et des drapeaux rouges partout, c’est tout à fait normal pour eux.


— (permalink)

Faire un "plein" de sa tuture électrique, sisi, et c'est plus rapide que de la recharger ! - Arfy'z tranche du Net

lundi 20 août 2018 à 16:58

Oh, ça c’est une bonne idée : et pourquoi pas une pile électrique où les deux électrolytes sont liquides et où il suffit juste de faire le plein des électrolytes (en vidant le reste qui est alors "rechargé" par la station ?

Sinon, l’idée d’avoir des batteries mobiles (quand la batterie est vide, on la sort, en remet une neuve, et l’ancienne est rechargée) est utilisé dans les usines pour les montes charges, tout ça. Également pour les perceuses ou les visseuses/dévisseuses, ou les mini-drônes de loisir.

En soit, c’est un peu ce qui se fait avec l’hydrogène : un moteur à hydrogène est un moteur électrique… où l’électricité est fourni par une réaction impliquant de l’hydrogène.
Le pot d’échappement ne rejette que de l’eau…
… et c’est de l’eau qui est utilisé pour refaire de l’H2 là où elle est produite.


— (permalink)

Wendover Productions - YouTube

lundi 20 août 2018 à 16:47

Une chaîne très intéressante sur un peu tout ce qui touche à l’ingénierie civile : du devenir des déchets de l’industrie nucléaire, aux avions de ligne, à la sécurité des aéroports, au système de bus/de train/des routes aux USA ; à quoi correspondent chacun des 40 véhicules mis en œuvre pour transporter le président US…

Y a aussi pas mal de trucs sur l’histoire et la géopolitique : en quoi la géographie ont fait des USA la puissance qu’ils sont, feront du Canada un important acteur maritime d’ici 50 ans, constituent un atout pour la Russie, ou la Chine ; à quoi sert l’Île de Guam…

Je n’ai pas tout regardé, mais je me régale.

Ou plutôt… je n’ai pas tout écouté : j’écoute ces épisodes en fond, au taf. Ça s’écoute très bien et l’image n’est pas toujours essentielle (parfois elle l’est, mais pas toujours).

Pour ceux qui connaissent, ça ressemble à Real Engeneering (une autre excellente chaîne).


— (permalink)

Où en sommes nous dans l’année ? - le hollandais volant

dimanche 19 août 2018 à 15:56

Une page qui affiche le pourcentage d’accomplissement de l’année courante, du mois courant, de la journée courante, de l’heure et de la minute.
Parce que j’aime mélanger prog, art, couleurs et aussi le temps qui passe :D

Oui, ceci utilise mon astuce de l’angle en CSS d’hier.

Ceci utilise de façon importante les CSS3 : les --variables, les calc(), les gradients, les ombres, les ::before et les ::after.
En HTML, j’utilise l’attribut data-ma-variable="". En JS, je modifie le HTML et le CSS.

Dans l’ensemble, tout est mélangé : le JS modifie l’attribut sur un élément HTML, le CSS récupère la valeur de cet attribut et le place dans le ::after, à l’écran. Par ailleurs, JS modifie la valeur de la --variable CSS, qui est ensuite appliquée à une propriété CSS sur un élément, ou sur le ::before d’un élément. C’est juste beau comment tout ça interagit dans tous les sens. On est loin du HTML4 et du CSS2 statique.

Et pourtant… le support navigateur de tout ça n’a jamais été aussi bon : cette page, sans faire d’ajustages particuliers, fonctionne aussi bien dans Chrome (chromium, vivaldi…) que dans Firefox, aussi bien sur desktop que mobile. Edge s’en sort sur les barres, mais pas sur le truc circulaire :/


— (permalink)

Home - Vitamania

dimanche 19 août 2018 à 15:00

Encore un docu par Derek Muller (le gars qui fait Veritasium).

Ça sera diffusé le 25/09 sur Arte.


— (permalink)

LEVITATION & How To Defy Gravity! - YouTube

samedi 18 août 2018 à 21:06

Ouais, je sais, encore PlasmaChannel… mais c’est tellement cool !


— (permalink)

An angle in pureCSS, enhanced with some JS.

samedi 18 août 2018 à 19:43

Faire un angle en CSS ? Facile.

Ce truc utilise du JS juste pour l’animation. Vous pouvez l’enlever.
Pour l’angle seul : https://codepen.io/lehollandaisvolant/pen/NLKGdL


— (permalink)