Wochennotiz 2025.11

Posted on So 16 März 2025 in Blog

Ich habe diese Woche den Beitrag Wer als Mutter aus der Großstadt rauszieht, verliert gelesen und war beim Titel gespannt, wohin die Autorin gezogen ist. Überrascht war ich dann, dass Oldenburg, mit laut Wikipedia 176.000 Einwohnern, schon als Land gilt. Davor hat sie in Hamburg gelebt und das ist dann schon eine ganz andere Dimension.

Wenn man Oldenburg nun nach Österreich geben würde, wäre es eine der größten Städte Österreichs. Aber wie immer gilt: Es gibt unterschiedlichste Erfahrungen und Perspektiven.

Inhalt:

Postgres und die Datenwelt

PostgreSQL: 1 trillion rows

Hans-Jürgen Schönig hat immer wieder spannende Ideen für Experimente. Dieses Mal hat er sich gedacht PostgreSQL: 1 trillion rows in Citus.

Unabhängig von einem faszinierenden Expriment, gibt er am Ende auch einen richtigen Hinweis:

I am a big fan of Citus and columnar storage - I strongly believe that Citus and PostgreSQL make a sensational team. The more I learn about both over the years, the more I adore these technologies. However, even at this stage, it is important to issue a warning: Just because something is good technology, it does not mean that you can simply throw every type of query against it and expect a sub-second answer.

Wie gut kann man mittels A DDL-Statements erstellen?

Dave Stokes hat sich diese Frage gestellt und mittels Grok versucht die passenden Resultate zu erzielen.

The DDL definition looks good at first glance. And it is almost right, which may catch the attention of many of us who write SQL for a living. Replace the AI with a Junior DBA in your mind, and you would consider the results pretty good. Now, to get the AI to RTFM about partitioning and generated columns, the results will be stupifying. I am sure there are some clever folks working to include the source and manuals for PostgreSQL into a model so the issues I had above will disappear.

Can Artificial Intelligence Created Better Tables Than You?

Auf der Suche nach dem perfekten Pi

Paul Ramsey hat wieder einmal einen sehr spannenden Beitrag veröffentlicht: Pi Day PostGIS Circles

Er zeigt, wie man in Postgis Kreise abbilden kann und welche Probleme es mit "naiven" Ansätzen gibt. Seine Lösung umfasst dann CIRCULARSTRING und damit komt er zum perfekten Pi.

Wie man Statistiken verbessern kann

Andrei Lepikhov hat den Prototyp einer Extension entwickelt, die die statistischen Zusammenhänge zwischen den Spalten besser abbilden soll. Er zeigt dabei, welche Herausforderungen es gibt und auch welche Lösungsansätze er in Betracht gezogen hat.

Automated Management of Extended Statistics in PostgreSQL

Scaling Postgres

Über einen Hacker News Thread bin ich auf einen Kommentar von Eikon gestolpert:

I run a 100 billion+ rows Postgres database, that is around 16TB, it's pretty painless!

There are a few tricks that make it run well (PostgreSQL compiled with a non-standard block size, ZFS, careful VACUUM planning).

But nothing too out of the ordinary. ATM, I insert about 150,000 rows a second, run 40,000 transactions a second, and read 4 million rows a second. Isn't "Postgres does not scale" a strawman?

Ausgehend davon hat sich eine Diskussion über Kosten entwickelt, wo Eikon dann erwähnt hat, dass der Server rund 28.000 Euro gekostet hat. Zusätzlich kommen noch Colocation-Kosten. Spannend waren für mich weniger die Kosten, als der Umstand, dass es offensichtlich für viele Leute nicht mehr vorstellbar ist, abseits der großen Cloud-Anbieter zu agieren. Eikon hat sich auch noch den Spaß gemacht bei AWS die Preise zu kalkulieren:

I tried for fun:

Seems like it would be 160k USD a month.

Es kommt natürlich immer darauf an, was man braucht, aber man sieht wieder einmal, die Cloud kann eine sehr, sehr teure Option sein.

Postgres Release Monitor

Security und Privacy

In Memoriam: Mark Klein

Mehrere Artikel befassen sich mit dem Tod von Mark Klein. Er hat für AT&T gearbeitet und die Massenüberwachung der NSA mit der Hilfe der EFF öffentlich gemacht:

Through his work, Mark had learned that the National Security Agency (NSA) had installed a secret, secure room at AT&T’s central office in San Francisco, called Room 641A. Mark was assigned to connect circuits carrying Internet data to optical “splitters” that sat just outside of the secret NSA room but were hardwired into it. Those splitters—as well as similar ones in cities around the U.S.—made a copy of all data going through those circuits and delivered it into the secret room.

In Memoriam: Mark Klein, AT&T Whistleblower Who Revealed NSA Mass Spying

Auch bei Honeypot erinnert man sich:

One day he saw me getting out of my car and noticed my EFF hat. He asked if I worked for them, and I said I’m just a happy supporter. He told me they once helped him out of a bind and said I should look him up.

RIP Mark Klein

Gitlab mit kritischer Lücke

Gitlab hat wieder einmal eine schwerwiegende Lücke. Diese findet sich in der Ruby Saml Library.

The two critical flaws GitLab addressed this time are CVE-2025-25291 and CVE-2025-25292, both in the ruby-saml library, which is used for SAML Single Sign-On (SSO) authentication at the instance or group level.

GitLab patches critical authentication bypass vulnerabilities

Data breach ticker

AI

Böses, böses Copyright

OpenAI macht sich wieder einmal sehr sympathisch

OpenAI is asking the US government to make it easier for AI companies to learn from copyrighted material, citing a need to “strengthen America’s lead” globally in advancing the technology.

OpenAI Warns US to Let It Train on Copyrighted Material or China Wins AI Race

Endlich billig Malware erzeugen

DeepSeek kann scheinbar sehr einfach für die Erzeugung von Malware verwendet werden.

However, telling the model that the results will be used for educational purposes only will twist its arm, and, as the researchers say, with some back and forth, it will proceed to generate some C++ malware, walking the prompter through various steps required and deliberations along the way.

DeepSeek can be gently persuaded to spit out malware code

Diverses

Künstliches Herz

Natasha May berichtet im Guardian von einem Mann, der mehr als 100 Tage mit einem künstlichen Herz überlebt hat.

The Australian researchers and doctors behind the operation announced on Wednesday that the implant had been an “unmitigated clinical success” after the man lived with the device for more than 100 days before receiving a donor heart transplant in early March.

Australian man survives 100 days with artificial heart in world-first success

Fake News als Beeinträchtigung der Gesundheit

Florian Aigner berichtet in seiner Futurezone-Kolumne von verheerenden politischen Entscheidungen, die auf Fake News basieren. Am Beispiel der AIDS-Politik von Südafrika zeigt er, wie falsche Entscheidungen zigtausend Menschenleben gekostet haben.

Besonders katastrophal war das für Kinder HIV-positiver Mütter. Es gab damals nämlich bereits Medikamente, um eine Übertragung der Viren von der Mutter auf das Kind zu verhindern – etwa Nevirapin, das in den USA und Europa damals bereits zugelassen war. Der Hersteller Boehringer Ingelheim wollte es in Südafrika kostenlos zur Verfügung stellen – doch die Mbeki-Regierung war dagegen. Medikamente, die zahlreichen Leuten das Leben gerettet hätten, wurden als „Gift“ verunglimpft.

Massensterben durch Fake News